上 暗 知 讽 
DARK 


KNOWEEDGE 


机 器 认 知 如 和 何 籁 覆 商 业 和 社会 


[ 美 ] 王 维 嘉 著 


斯 坦 福 大 学 博士 ， 在 硅谷 创业 投资 30 余 年 
曾 师 从 人 工 智能 鼻祖 之 一 、 美 国 国家 工程 院 院 士 伯 纳 德 ' 威 德 罗 教授 


重 构 知 误 版 图 ， 台 别 AI 核 心 技 术 ， 千 握 机 如 认 知 时 代 的 投资 、 就 业 法 则 
金 观 涛 作 序 | 伯 纳 德 " 威 德 罗 李开复 罗 振 字 徐小平 任志强 | 重 磅 推荐 


中 信和 出 版 集团 


版 权 信息 


书 名 : 暗 知识 : 机 器 认 知 如 何 颠 履 商 业 和 社会 
作者 :[ 美 ] 王 维 喜 

ISBN:9787508692982 

中 信 出 版 集团 制作 发 行 

版 权 所 有 -侵权 必 究 


iy 


耻 


4 


一 直 以 来 人 类 的 知识 可 以 分 为 两 类 :“ 明 知识” 和 “ 默 知识 ” (Tacit 
Knowldge， 又 称 默 会 知识 ) 。 明 知识 就 是 那些 可 以 用 文字 或 公式 清晰 
描述 和 表达 出 来 的 知识 。 默 知识 则 是 个 人 在 感觉 上 能 把 握 但 无 法 清晰 
描述 和 表达 的 知识 ， 也 即 我 们 常 说 的 “只 可 意 会 ， 不 可 言传 ”的 那 类 知 
识 。 人 类 发 明文 字 以 来 ， 积 累 的 知识 主要 是 明知 识 ， 因 为 只 有 明知 识 
才 可 以 记录 和 传播 。 直 到 大 约 70 年 前 ， 人 类 才 意 识 到 默 知识 的 存在 。 
今天 ， 人 工 智能 ， 特 别 是 其 中 的 一 个 重要 流派 一 一 神经 网 络 ， 突 然 发 
现 了 海量 的 、 人 类 既 无 法 感受 又 无 法 描述 和 表达 的 “ 暗 知识 “一 一 隐藏 
在 海量 数据 中 的 相关 性 ， 或 者 万 事 万 物 间 的 隐蔽 关系 。 这 些 蜡 知识 可 
以 让 我 们 突然 掌握 不 可 思议 的 “魔力 ”， 能 够 做 很 多 过 去 无 法 想象 的 事 
情 。 本 书 就 是 要 清楚 阐述 机 器 学 习 发 掘 出 了 什么 样 的 暗 知识 ， 为 什么 
机 器 能 够 发 现 这 些 瞳 知识 ， 以 及 这 些 瞳 知识 对 我 们 每 个 人 会 有 什么 影 
响 。 

本 书 分 为 三 个 部 分 。 

第 一 部 分 包括 第 一 、 二 、 三 章 ， 其 中 第 一 章 里 我 们 发 现 AlphaGo 
(阿尔 法 围棋 ) 给 我 们 带 来 的 最 大 震撼 是 人 类 完全 无 法 理解 机 器 关于 
下 棋 的 知识 。 这 个 发 现 迫 使 我 们 重新 审视 人 类 对 于 “知识 * 的 所 有 观 
念 。 这 一 章 回顾 了 2 500 年 来 人 类 所 熟悉 的 明知 识 和 直至 大 约 70 年 前 才 
注意 到 的 默 知识 。 近 几 十 年 的 脑 神经 科学 的 研究 成 果 让 我 们 对 知识 的 
本 质 有 了 更 清楚 的 认识 ， 也 回答 了 为 什么 人 类 既 无 法 感受 ， 也 无 法 理 
解 机 器 发 现 的 那些 暗 知识 。 这 一 章 还 分 析 了 明知 识 、 默 知识 和 暗 知 识 
之 间 的 区 别 ， 讨 论 了 为 什么 暗 知识 的 总 量 将 远 远 超过 人 类 能 掌握 的 所 
有 知识 。 


第 二 章 介绍 了 机 志 征 怎样 学 习 的 ， 能 学 习 哪些 知识 ， 同 时 介绍 了 
机 器 学 习 的 五 大 流派 以 及 各 流派 从 数据 中 挖 气 知 识 的 方法 。 

第 三 章 则 重点 介绍 了 目前 机 器 学 习 中 最 火 的 神经 网 络 ， 包 括 神 经 
网 络 的 基本 工作 原理 和 目前 在 商业 上 应 用 最 广 的 几 种 形态 ， 以 及 各 和 目 
适用 的 领域 。 有 了 这 些 基础 就 可 以 判断 AI 《人 工 智能 ) 在 各 个 行业 的 
商业 机 会 和 风险 。 也 只 有 理解 了 这 些 原理 ， 才 能 真正 理解 瞳 知识 的 特 
上 态 。 为 易于 阅读 和 照顾 不 同 读 者 的 需求 ， 在 这 一 革 中 我 们 尽量 用 通俗 
的 语言 解释 这 些 工 作 原理 ， 而 把 精确 的 技术 原理 介绍 放 在 附录 里 。 

第 二 部 分 〈 第 四 、 五 章 ) 讨论 了 AI 对 商业 的 影响 。 我 们 将 看 到 机 
妖 发 据 出 来 的 瞳 知识 对 我 们 生活 的 直接 影响 。 对 于 想 把 握 AI 丙 业 趋势 
的 读者 来 说 ， 这 部 分 的 内 容 至 天 重要 。 其 中 ， 第 四 章 描 述 了 当前 的 AI 
产业 生态 ， 第 五 章 详尽 探讨 了 哪些 行业 将 面临 AI 的 颠覆 ， 以 及 在 不 同 
行业 的 投资 机 会 和 陷阱 。 

第 三 部 分 〈 第 六 、 七 章 ) 的 内 容 是 AI 对 未 来 和 社会 的 影响 。 第 六 
章 重点 讨论 目前 还 没有 商业 化 的 ， 但 可 能 更 深刻 影响 我 们 的 一 些 神奇 
的 AI 应 用 。 第 七 章 讨论 了 机 器 和 人 的 关系 : 机 右 能 在 多 大 程度 上 取代 
人 的 工作 ， 会 造成 哪些 社会 问题 (例如 大 面积 失业 ) 。 这 两 章 的 主要 
目的 是 开 脑 洞 ， 探 讨 那些 我 们 今天 可 能 还 看 不 到 的 更 深远 的 影响 。 本 
章 也 试图 回答 人 类 的 终极 恐惧 : 机 郁 人 最 终 会 控制 人 类 吗 ? 

本 书 的 各 个 章节 前 后 连贯 ， 但 也 可 以 跳 着 读 ， 对 于 那些 只 对 商业 
感 兴趣 的 读者 ， 可 以 跳 过 第 二 、 三 章 直 接 读 第 四 、 五 章 。 

笔者 在 美国 斯 坦 福 大 学 读 博士 期 间 做 过 人 工 智能 人 研究， 后 来 在 仁 
合 和 中 国 创办 高 科技 公司 ， 目 前 在 硅谷 专注 于 投资 人 工 智能 。 每 年 访 
问 调 研 上 千家 硅 合 和 中 国 的 科技 公司 ， 接 触 顶 级 大 学 最 前 沿 的 研究 ， 
这 些 都 有 助 于 笔者 从 大 量 的 实践 中 提炼 出 目 己 对 行业 的 原创 的 分 析 和 
洞 见 ， 而 不 是 人 云 亦 云 。 


笔者 长 期 对 人 类 如 何 获得 知识 感 兴趣 ， 在 投资 、 研 究 和 写作 AI 的 
过 程 中 ， 发 现 了 暗 知识 这 样 一 个 人 类 以 往 未 曾 发 现 的 领域 。 这 个 概念 
的 提出 一 定 会 引起 争议 ， 笔 者 欢迎 读者 的 批评 并 期 待 在 批评 和 讨论 中 
进一步 深化 在 这 方面 的 认识 。 

本 书 的 目标 读者 是 企业 和 政府 工作 人 员 及 其 他 知识 阶层 ， 包 括 学 
生 。 瞳 知识 对 人 类 的 影响 刚刚 开始 。 从 瞳 知识 这 个 新 视角 出 发 ， 可 以 
更 深刻 地 理解 这 次 AI 巨 浪 。 这 波 巨 浪 可 能 超过 互联 网 ， 许 多 行业 都 会 
深 受 影响 。 本 书 希望 能 回答 “AI 对 我 的 行业 和 职业 会 有 什么 影响 ”。 只 
有 把 AI 的 技术 、 趋 势 和 应 用 深入 浅 出 地 讲 清楚 ， 读 者 才 可 能 举 一 反 
三 ， 理 解 AI 对 自己 的 影响 。 本 书 从 笔 考 自己 的 投资 实践 出 发 ， 希 望 能 
为 在 AI 时 代 进 行 投资 提供 一 些 参考 。 在 AI 飓 风 里 泥 沙 俱 下 ， 鱼 龙 混 
杂 ， 会 有 大 量 的 炒作 ， 读 完 本 书 可 以 帮助 读者 辨别 真 伪 ， 不 会 被 轻易 
忽悠 。 在 今后 5~10 年 ， 不 论 是 风险 投资 / 私 幕 股权 投资 还 是 在 公开 股票 
市 场 投资 都 需要 有 这 样 的 辨别 能 力 。 本 书 最 后 在 讨论 人 工 智 能 对 整个 
社会 的 影响 时 也 提出 了 一 些 未 经 检验 的 建议 。 

每 当 读 到 市 面 上 科技 类 的 书籍 时 ， 常 被 那些 含混 不 清 的 描述 所 困 
扰 。 当 年 在 斯 坦 福 大 学 上 课时 留 下 的 最 深 印 象 就 是 那些 学 科 的 开山 鼻 
祖 对 自己 学 科 理解 之 深入 。 他 们 能 用 最 简单 的 方式 把 最 深奥 的 道理 讲 
明白 ， 让 听课 的 学 生 一 下 子 就 能 理解 一 门 学 科 的 核心 概念 ， 而 且 一 莘 
子 不 会 忘记 。 从 那 以 后 ， 笔 者 就 坚信 ， 如 果 学 生 没 听 懂 ， 一 定 是 老师 
没 讲 明白 。 这 本 书 希望 用 最 通俗 易 懂 的 语言 介绍 暗 知识 和 AI。 任 何 具 
有 高 中 以 上 学 历 的 读者 如 果 有 没 读 懂 的 地 方 ， 一 定 是 因为 笔者 没有 写 
明白 。 

今天 每 个 人 都 要 面 对 海 量 的 信息 和 知识 ， 如 何 让 读者 花 最 少 的 时 
间 获取 最 大 量 的 信息 和 知识 成 为 一 个 挑战 。 笔 者 最 欣赏 的 文章 和 书籍 
是 那些 没有 一 句 多 余 的 话 的 ， 这 也 是 笔者 写作 本 书 的 目标 之 一 。 本 书 
希望 能 够 做 到 读者 在 机 场 书店 买 了 这 本 书后 能 在 下 飞机 前 读 完 ， 而 且 
读 完 之 后 可 以 清晰 地 判断 这 场 技术 大 浪 对 自己 的 影响 。 


王 维 嘉 
2019 年 1 月 13 日 于 人 硅谷 


“ 暗 知 识 * 和 现代 社会 


和 目 2017 年 AlphaGo 大 胜 柯 洁 ， 人 工 智能 即将 碾 轧 人 类 的 话题 便 进 
入 大 众 视野 ， 迅 即 引起 普 壳 的 狂热 和 焦虑 。 我 认为 ， 王 维 亮 这 本 《 暗 
知识 : 机 需 认 知 如 何 颠 颖 商业 和 社会 》 的 出 版 ， 是 对 这 种 情绪 鸣 有 效 
清醒 剂 和 解毒 药 。 

说 这 本 书 是 清醒 剂 ， 是 因为 它 极 为 简明 清晰 地 和 哲 述 了 人 工 乔 能 的 
科学 原理 及 其 技术 实现 ， 无 论 是 神经 网 络 结构 ， 其 目 我 学 习 的 过 程 ， 
还 是 深度 学 习 和 卷 积 机 制 ，《 暗 知识 : 机 器 认 知 如 何 址 履 丙 业 和 社 
会 》 比 现在 出 版 的 任何 一 本 书 都 讲 得 更 清楚 、 易 读 。 以 人 类 认 知 为 背 
景 来 解读 人 工 知 能， 正好 可 以 为 当前 人 工 智能 领域 中 泛 起 的 非 理 性 狂 
热 降温 。 其 实 ， 早 在 20 世 纪 60 年 代 ， 控 制 论 创始 人 维 纳 (Norbert 
Wiener) 的 学 生 阿 比 布 (Michael Arbib) 在 《大 脑 、 机 器 和 数学 》 一 
书 中 ， 已 经 清晰 地 叙述 了 神经 元 网 络 数学 模型 和 学 习 机 原理 ， 并 讲 过 
这 些 原理 有 助 于 我 们 * 从 “机 器 ' 中 : 赶 走时 吏 ”。 阿 比 布 讲 的 “机 需 ? 是 指 
大 脑 的 记忆 、 计 算 和 学 习 等 功能 ， 它 们 目 香 卡 儿 以 来 被 视 为 机 器 的 有 
机 体 〈 生 物 ) ,“ 鬼 魂 " 则 是 指 生 物 的 本 能 和 学 习 能 力 。 而 王 维 嘉 的 
《上 暗 知 识 : 机 老 认 知 如 何 题 履 商 业 和 社会 》 一 书 ,“ 赶 走 ” 的 不 是 以 往 
所 说 的 有 机 体 的 神秘 性 ， 而 是 对 人 工 智 能 研究 和 可 能 性 的 想象 中 的 “ 罗 
魂 ”"， 即 误 以 为 当 神 经 元 网 络 的 连接 数量 接近 于 人 脑 时 ， 它 们 会 涌现 出 
如 人 类 那样 的 目 我 意识 和 主体 性 等 。 


人 工 智能 的 神经 元 网 络 系统 能 做 什么 ?” 如 上 所 说 ， 嘻 在 它 被 做 出 
来 以 前 ， 数 学 家 已 经 证 明 ， 无 论 神经 元 网 络 多 么 复杂 ， 它 等 价 于 有 限 


目 动机， 而 一 个 能 和 环境 确定 性 互动 〈 自 耦合 、 反 馈 和 自我 学 习 ) 的 
有 限 自 动机 (神经 元 网 络 ) ， 只 不 过 是 某 一 种 类 型 的 图 灵机 (通用 计 
算 机 ) 。 

也 就 是 说 ， 人 工 智能 革命 之 基础 一 一 神经 元 网 络 的 目 我 学 习 及 其 
与 环境 互动 所 能 达到 的 极限 ， 都 超 不 过 图 灵机 的 行为 组 合 。 从 20 世 纪 
下 半 叶 人 至今， 伴随 大 人工 知 能 的 快速 、 高 度 发 展 ， 关 于 它 能 否 在 霖 来 
某 一 天 具有 意识 的 讨论 ,一直 是 在 电脑 和 人 脑 差 别 的 框架 中 展开 的 。 
我 认为 ， 只 要 发 展 出 相应 的 数学 理论 ， 就 能 了 解 神经 元 网 络 学 习 已 做 
出 的 和 可 能 做 的 一 切 。 但 有 一 点 是 到 无 疑问 的 ， 它 不 可 能 具有 目 我 意 
识 、 主 体 性 和 自主 性 。 

为 什么 说 这 本 书 是 解毒 药 ” 因为 维 嘉 在 解释 为 什么 人 工 智 能 可 以 
比 人 更 多 、 更 快 地 掌握 知识 〈 能 力 ) 时 ， 把 人 工 智 能 所 掌握 的 信息 定 
义 为 “ 瞳 知识 ”"， 从 而 可 以 得 出 清晰 的 理论 表述 。 我 们 首先 要 和 弄 明 白 什 
么 是 知识 ， 知 识 就 是 人 获得 的 信息 。 而 人 利用 信息 (知识 ) 离 不 开 获 
得 信息 和 表达 信息 两 个 基本 环节 ， 人 获得 信息 是 用 感官 感知 〈 即 经 验 
的 ) ， 表 达 信息 是 通过 符号 (语言 ) 和 对 符号 结构 之 研究 (符号 可 以 
征 非 经 验 的 ) 。 这 样 ， 他 根据 “可 否 感知 ”和 “可 否 表达 ”， 把 人 可 利用 
的 知识 分 为 如 下 四 种 基本 类 型 : 


第 一 ， 可 感知 亦 可 表达 的 知识 。 它 包括 迄今 为 止 所 有 的 科学 和 人 
区 和 间 调 2 

第 二 ， 不 可 感知 但 可 表达 的 知识 。 任 何 经 验 的 东西 都 是 可 感知 
的 ， 不 可 感知 的 就 是 非 经 验 的 。 有 这 样 的 知识 吗 ? 当然 有 。 以 数学 为 
例 ， 抽 象 代数 的 定理 是 正确 的 知识 ， 但 可 以 和 经 验 无 天 。 人 之 所 以 为 
人 ， 就 在 于 可 以 拥有 纯 符 号 的 知 织 ， 它 是 理性 的 重要 基础 。 


第 三 ， 可 感知 但 不 可 表达 的 知识 。 它 包括 人 的 非 陈述 性 记忆 和 “上 默 


会 知识 ”* 


第 四 ， 不 可 感知 亦 不 可 表达 的 知识 。 这 就 是 当前 神经 元 网 络 通过 
学 习 掌 握 的 知识 。 维 嘉 将 这 类 大 大 超出 了 个 别人 所 能 记忆 和 学 习 的 知 
识 称 为 “ 蜡 知 识 ”。“ 瞳 知识 ”的 提出 ， 不 仅 是 一 项 哲学 页 献 ， 也 为 当前 
盛行 的 科学 乌托邦 提供 了 一 剂 解 毒药 。 

20 世 纪 社 会 人 文 研究 最 重要 的 成 承 ， 殉 是 发 现 “ 默 会 知识 ”和 市 场 
的 关系 。 人 类 可 共生 的 知识 都 是 可 以 用 符号 表达 的 知识 ， 但 它 不 可 能 
包含 每 个 人 都 具有 的 “ 黑 会 知识 ”。 经 济 学 家 利用 *“ 黑 会 知识 ”的 存在 ， 
证 明了 基于 理性 和 科学 知识 的 计划 经 济 不 可 能 代替 市 场 机 制 。 一 个 充 
分 利用 人 类 知识 的 社会 ， 一 定 和 是 立足 于 个 人 目 主 、 互 相交 换 目 己 的 能 
力 和 知识 所 形成 的 契约 组 织 。 忽 视 所 有 个 人 具有 的 “ 默 会 知识 "， 把 基 
于 理性 和 可 表达 的 知识 设计 出 的 社会 制度 付 诸 实践 ， 会 出 现 与 原来 意 
图 相反 的 后 果 。 哈 耶 克 称 这 种 对 可 表达 知识 的 迷信 为 “理性 的 目 负 ”。 
今天 随 看 大 数据 的 应 用 ， 这 种 理性 的 目 负 再 一 次 出 现在 人 工 状 能 领 
域 。 而 “ 瞳 知识 ”的 提出 ， 扩 大 了 不 能 用 符号 表达 知识 的 范围 ， 进 一 步 
证 明了 哈 耶 元 的 正确 性 。 所 以 ， 我 说 这 本 书 是 对 当前 理性 自负 的 有 效 


解毒 药 。 


维 嘉 在 书 中 提出 的 另 一 个 有 意义 的 问题 是 “ 暗 知 识 ” 会 在 何 种 程度 
上 改变 现代 社会 。 正 如 该 书 副标题 所 说 ， 这 种 新 型 知识 大 规模 的 运 
用 ， 将 会 导致 大 量 拥有 专门 知识 和 技能 的 人 失业 、 一 批 又 一 批 的 行业 
消失 ， 甚 至 连 医生 专家 都 可 能 被 取代 。 姑 且 不 论 这 种 预测 是 否 准确 ， 
有 一 点 是 肯定 的 ， 即 人 工 知 能 必定 会 极 大 地 改变 我 们 赖 以 生存 的 社 
会 。 那 么 ， 它 会 把 人 类 社会 市 到 哪里 去 ? 这 正 是 人 工 智能 音 命 带 来 的 
普遍 焦虑 之 一 。 人 工 智能 对 城市 管理 和 对 每 个 人 私 隐 的 和 掌握， 是 否 会 
导致 个 人 目 由 和 隐私 的 丧失 ? 由 大 数据 和 人 工 智能 高 科技 管理 的 社 
会 ， 还 是 契约 社会 吗 ? 

现代 社会 和 传统 社会 的 本 质 不 同 就 在 于 其 高 度 强调 个 人 的 主体 性 
和 创造 性 ， 任 何 信息 的 获得 、 表 达 和 应 用 都 离 不 开 个 人 的 主体 性 和 创 
造 性 。 我 认为 ， 人 工 智能 可 以 具有 掌握 “ 瞳 知识 ”的 能 力 ， 但 它 不 可 能 


具有 目 我 意识 ， 当 然 亦 无 所 谓 主 体 性 ， 它 只 能 被 人 所 拥有 。 因 此 ， 一 
个 能 允许 知识 和 技术 无 限制 进步 的 社会 ， 仍 然 是 建立 在 个 人 净 约 之 上 
的 。 也 就 是 说 ， 无 论 科学 技术 发 展 到 什么 程度 ， 现 代 社 会 的 性 质 不 会 
因 之 而 改变 。 


然而 ， 我 认为 ， 人 工 智 能 或 许 会 使 现代 社会 的 科技 组 织 的 形式 发 
生 改变 。 为 什么 现代 社会 需要 科 层 组 织 ? 众所周知 ， 现 代 社 会 除了 由 
法 律 身 约 提供 组 织 框架 以 外 ， 还 必须 回 所 有 人 提供 不 同类 型 的 公共 
事务 服务 ， 如 治安 、 交 通 设施 、 教 育 、 医 疗 等 。 为 此 束 要 设立 处 理 不 
同类 型 事务 的 专门 机 构 来 管理 社会 ， 如 军队 和 政府 科 层 组 织 。 科 层 组 
织 之 间 功 能 的 实现 和 协调 ， 要 利用 符号 表达 的 共 译 知 识 ， 因 此 ， 随 着 
现代 社会 的 复杂 化 ， 必 定 出 现 技 术 官 僚 的 膨胀 。 而 人 工 智 能 革命 和 "“ 障 
知识 ”的 运用 ， 必 有 定 会 同 社 会 管理 层面 深入 。 如 有 果 它 运用 得 不 好 ， 会 使 
现代 社会 生长 出 超级 而 无 能 的 官僚 机 构 的 毒瘤 ;如 采 它 运用 得 好 ， 可 
以 促使 人 更 好 地 发 挥 目 主 性 和 创造 性 ， 甚 至 可 以 取代 科 层 管理 中 不 必 
要 的 机 构 。 因 此 ， 我 认为 人 工 知 能 将 会 在 这 一 层面 给 现代 社会 市 来 巨 

影响 。 

科 层 组 织 的 形成 和 理性 化 的 关系， 是 韦伯 分 析 现 代 社 会 的 最 重要 
贡献。 在 未 来 ， 随 着 人 工 闹 能 对 “ 瞳 知识 ”的 掌握 和 运用 向 社会 管理 渗 
透 ， 甚 而 蔡 代 ， 将 会 证 明 韦 伯 这 一 重要 论断 不 再 成 立 。 可 惜 的 是 ， 维 
嘉 的 《上 暗 知识 : 机 器 认 知 如 何 三 履 商 业 和 社会 》 一 书 忽略 了 人 工 关 能 
革命 和 现代 社会 官僚 化 关系 的 讨论 。 科 层 组 织 的 设立 是 基于 理性 ( 共 
享 知 识 ) ， 人 工 智能 擅长 的 是 掌握 “上 暗 知 识 "， 如 果 从 事 社会 公共 事务 
管理 的 人 员 可 以 被 掌握 “ 暗 知识 ”的 人 工 智能 取代 ， 科 层 组 织 还 有 存在 
的 必要 吗 ? 或 者 ， 它 将 以 什么 样 的 新 形式 存在 ? 如果 不 再 需要 科 层 组 
织 ， 未 来 无 政府 的 现代 社会 将 如 何 运行 ? 这 正 是 我 们 应 该 关注 的 ， 它 
需要 人 文 和 科学 两 个 领域 的 对 话 。 


金 观 涛 
2019 年 2 月 
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译 : 我 非常 高 兴 失 


分 析 。 我 希望 这 个 技术 将 被 用 来 


威 德 罗 ，2019 年 2 


E 荐 这 本 书 。 这 


CF 书 对 机 恬 学 习 的 发 明 带 来 的 下 一 场 ] 
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月 26 日 于 斯 坦 福 


EFE 活 更 美好 、 更 和 


FE ， 并 不 再 有 战争 。 


[ 业 革 命 进行 了 详尽 
人 


A es oa ee te 
够 自我 学 习 的 机 器 给 了 我 们 当头 一 棱 : 机 器 发 现 了 一 类 人 类 既 无 
法 感受 ， 也 不 和 人 g 理 解 的 知识 。 这 类 知识 的 发 现 ， 逼 迫 我 们 重新 审 
视 过 去 所 有 关于 知识 的 观念 。 我 们 回顾 了 2 500 年 来 在 这 个 问题 上 
的 争论 : 知识 是 通过 经 验 得 到 的 还 是 通过 推理 得 到 的 ? 直到 大 约 
70 年 前 人 们 才 注 意 到 那些 “只 可 意 会 ， 不 可 言传 ”的 默 知 识 的 重要 
性 。 但 这 些 争 论 在 最 新 的 脑 科 学 研究 结果 面前 都 显得 肤浅 和 和 苍 
白 。 最 近 几 十 年 的 科学 研究 确认 了 认 知 的 基础 是 大 脑 神经 元 之 间 
的 连接 。 有 了 这 个 基础 ， 我 们 就 很 容易 理解 为 什么 有 些 知 识 无 法 
表达 ， 也 才能 明白 为 什么 人 类 无 法 理解 机 器 刚刚 发 现 的 这 些 暗 知 
。 在 此 基础 上 ， 我 们 终于 可 以 清晰 地 区 分 这 样 三 类 知识 : 人 类 
能 掌握 的 明知 识 和 默 知识 以 及 只 有 机 器 才能 掌握 的 暗 知识 。 


攻 做 的 人 类 


也 许 是 由 于 几 十 万 年 前 人 类 远古 祖 移 某 个 基因 的 突变 ， 人 们 开始 
可 以 把 一 些 有 固定 意思 的 发 音 片 段 组 装 成 一 个 能 表达 更 复杂 意思 的 发 
音 序列 。 这 些 发 音 搬 段 今天 我 们 叫 作 * 单 词 ”， 这 个 表达 特定 内 容 的 发 
普 序 列 今天 我 们 叫 作 “句子 *”。 这 种 “组 装 ” 能 力 使 人 类 用 有 限 的 单词 可 
以 表达 几乎 无 穷 多 种 意思 ， 语 言 诞生 了 。 有 了 语言 的 复杂 表达 能 
人 类 的 协作 能 力 开始 迅速 提高 ， 可 以 几 十 人 一 起 围 狂 大 型 动物 ， 很 快 
人 类 就 上 升 到 地 球 生 物 链 的 顶端 。 作 为 记录 语言 的 符号 一 一 文字 的 发 
明 可 以 让 人 类 更 方便 地 传播 、 记 录 和 积累 经 验 。 任 何 一 个 地 方 的 人 类 
偶然 发 现 的 天 于 生存 的 知识 都 会 慢 慢 传播 开 来 。 一 万 年 前 ， 农 业 起 源 
于 今天 的 埃及 、 和 叙利亚 和 伊拉克 的 肥沃 新 月 市 ， 这 些 种 植 经 验 在 几 干 
年 中 传 和 珊 全 世界 ， 随 之 而 来 的 是 人 类 迅速 在 地 球 所 有 适宜 农耕 的 角落 
定居 繁 人 入。 

随 着 定居 的 人 类 数量 的 增加 ， 人 类 的 组 织 开始 变 得 更 大 更 复杂 ， 
从 亲 绿 家 族 到 部 落 ， 到 城 孝 ， 再 到 国家 。 大 规模 的 复杂 组 织 可 以 开展 
大 规模 的 复杂 工程 ， 如 建设 城市 、 庙 宇和 大 规模 灌溉 系统 。 这 些 大 规 
模 工 程 需要 更 多 的 天 文 和 数学 知识 。 世 界 上 几乎 所 有 的 古老 文明 都 积 
累 了 许多 天 文 知 识 ， 但 只 在 希腊 半岛 诞生 了 现代 科学 的 黄 基 石 一 数 
学 。 欧 几 里 得 (Euclid， 公 元 前 330 一 前 275) 在 公元 前 300 年 总 结 了 他 
前 面 100 年 中 希腊 先哲 的 数学 成 果 ， 写 出 了 人 类 历史 上 最 伟大 的 书 之 一 
《几何 原本 》 (Elements) 。 这 本 书 在 中 世纪 由 波斯 裔 的 伊斯兰 学 者 
翻译 成 阿拉 伯 文 ， 又 从 阿拉 伯 传 回 文艺 复兴 前 的 欧洲 ， 直 接 有 影响 了 从 
哥 白 尼 (Nicolaus Copernicus ，1473 一 1543) 到 牛顿 (Issac Newton ， 
1643 一 1727) 的 科学 革命 。 

发 加 于 16 世 纪 的 科学 革命 的 本 质 是 什么 ? 是 发 现 更 多 的 知识 吗 ? 
是 创造 出 更 多 的 工具 吗 ? 都 不 是 。 科 学 革命 的 本 质 是 找到 了 一 个 可 靠 
的 验证 知识 的 方法 。 

最 能 体现 科学 革命 本 质 的 就 是 天 文学 家 开 普 勒 (Johannes 
Kepler，1571 一 1630) 发 现 三 定律 的 过 程 。 最 初 ， 在 作为 主流 的 托 勒 


密 (Ptolemy，90 一 168) 地 心 说 越 来 越 无 法 解释 天 体 观测 数据 时 ， 哥 
白 尼 提出 了 日 心 说 ， 用 新 的 模型 解释 了 大 部 分 过 去 无 法 解释 的 数据 。 
与 伽利略 (Galileo Galilei，1564 一 1642) 同时 代 的 天 文学 家 第 谷 : 布 拉 
赫 (Tycho Brahe ，1546 一 1601) 没有 接受 哥 白 尼 的 日 心 说 ， 他 提出 
了 “月亮 和 行星 绕 着 太阳 转 ， 太 阳 带 着 它们 绕 地 球 转 ” 的 “日 心 一 地 不 
动 *? 说 。 遗 憾 的 是 ， 他 倾 尽 毕生 心血 观察 了 20 年 的 天 文 数据 ， 直 到 去 世 
都 始终 无 法 让 观测 到 的 数据 与 自己 的 模型 相 吻合 。 


在 第 谷 去 世 后 ， 第 谷 的 助手 开 普 勒 拿 到 了 他 的 全 部 数据 ， 开 普 勒 
完全 接受 了 哥 日 尼 的 日 心 说 。 他 为 了 让 数据 与 日 心 说 完全 吻合 ， 把 哥 
日 尼 的 地 球 公转 的 圆 形 轨 道 修正 为 椭圆 轨道 ， 太 阳 在 椭圆 的 一 个 焦点 
上 。 这 就 古 开 普 勒 第 一 定律 。 他 用 相同 的 方法 发 现 了 其 他 两 个 定律 。 
开 普 勒 三 定律 不 仅 完 满 解释 了 第 合 的 所 有 观测 数据 ， 并 且 能 够 解释 任 
何 新 观测 到 的 数据 。 


这 个 发 现 过 程 有 三 个 步骤 : 第 一 ， 积 素 足 够 的 观测 数据 (第 合 20 
年 的 观测 数据 ) ; 第 二 ， 提 出 一 个 移 验 的 世界 模型 ( 哥 白 尼 的 “日 心 
说 ”) ; 第 三 ， 调 整 模型 的 参数 直至 能 够 完美 拟 合 已 有 的 数据 及 新 增 数 
据 〈 把 圆周 轨道 调整 为 椭圆 轨道 ， 再 调整 椭圆 轴 距 以 拟 合 数据 ) 。 验 
证 了 这 个 模型 有 什么 用 ? 最 大 的 用 处 惑 是 可 以 解释 狐 的 数据 或 做 出 预 
测 。 在 这 里 开 普 勒 三 定律 就 是 新 发 现 的 知识 。 发 现 知识 的 可 靠 方 法 就 
征 不 断 修改 模型 使 模型 与 观测 数据 完全 吻合 。 

上 面 这 三 个 步骤 芮 定 了 现代 科学 的 基本 原则 ， 正 式 吹 啊 了 科学 单 
命 的 号 角 ， 直 搂 导 致 了 后 来 的 牛顿 万 有 引力 的 发 现 ， 一 直 影 响 到 今 
Fg 

过 去 500 年 中 人 类 对 世界 的 认识 突飞猛进 ,今天 大 到 字 害 ， 小 到 奔 
克 都 似乎 尽 在 人 类 的 掌握 之 中 。 人 类 可 以 上 天 、 入 地 、 下 海 ， 似 乎 无 
所 不 能 。 人 类 有 了 “ 干 里 上 腿 *“ 顺 风 耳 ”"， 甚 至 开始 像 * 上 帝 ” 一 样 设计 新 
的 物种 ， 并 企图 改变 人 类 进化 的 进程 。 人 类 有 理由 相信 没有 什么 知识 


征 不 能 理解 的 ， 也 没有 什么 知识 是 不 能 被 发 现 的 .…… 直 到 2016 年 3 月 15 
日 


[© 


天 才 的 别 啊 


2016 年 3 月 15 日 ， 美 国 谷歌 公司 的 围棋 对 奔 程 序 AlphaGo 以 五 局 四 
胜 的 成 绩 战胜 世界 围棋 冠军 韩国 选手 李 世 石 。 一 时 间 这 个 消息 友 动 世 
E， 全 世界 有 28 亿 人 在 关注 这 场 比赛 ， 在 中 国 更 是 引起 极 大 的 缀 动 。 
人 们 感觉 AlphaGo 就 像 从 石头 颖 里 蹦 出 来 的 孙悟空 一 样 ， 完 全 无 法 理 
解 一 台 机 器 如 何 能 够 打败 世界 围棋 冠军 。 围 棋 历 来 被 认为 是 人 类 最 复 
杂 的 游戏 之 一 。 围 棋 每 一 步 的 可 能 的 走 法 大 约 有 250 种 ， 下 完 一 盘 棋 平 
均 要 走 150 步 ， 这 样 可 能 的 走 法 有 250150=10360 种 ， 而 宇宙 从 诞生 到 现 
在 才 1017 秒 ， 即 使 是 现在 世界 上 最 快 的 超级 计算 机 ， 要 想 把 所 有 走 法 
走 一 遍 ， 计 算 时 间 也 要 比 宇 宙 年 龄 都 长 。 即 使 排除 了 大 部 分 不 可 能 的 
走 法 也 是 大 到 无 法 计算 。 机 器 是 怎样 学 会 这 么 复杂 的 棋艺 的 ? 
这 场 比赛 后 ， 世 界 排 名 第 一 的 棋 手 柯 尘 在 网 上 说 : “AlphaGo 胜 得 
了 李 世 石 ， 胜 不 了 我 。” 而 2017 年 5 月 28 日 ， 棋 手 柯 洁 以 0: 3 完 败 
AlphaGo， 彻 底 击 碎 了 人 类 在 这 种 复杂 游戏 中 的 尊严 。 赛 后 ， 这 位 天 
才 少 年 一 度 吓 咽 ， 在 接受 采访 时 柯 洁 感 叹 ，AlphaGo 太 完美 ， 看 不 到 
任何 胜利 的 希望 。 他 流 着 眼泪 说 : “我 们 人 类 下 了 2 000 年 围棋 ， 连 门 
都 没入 。” 中 国 棋 圣 聂 卫 平 更 是 把 AlphaGo 尊 称 为 “ 阿 老师 >”， 他 
说 : “AlphaGo 的 着 数 让 我 看 得 如 醉 如 痴 ， 围 棋 是 何等 的 深奥 和 神秘 。 
AlphaGo 走 的 顺序 、 时 机 掌握 得 非常 好 。 它 这 个 水 平 完 全 超越 了 人 
类 ， 跟 它 挑战 下 棋 ， 只 能 是 找 死 。 我 们 应 该 让 阿 老 师 来 教 我 们 下 
棋 。” 他 还 说 : “ 阿 老师 至 少 是 20 段 ， 简 直 是 围棋 上 带 。” 


当 人 们 以 为 这 是 对 弈 类 程序 的 高 峰 时 ，AlphaGo 的 人 研发 团队 
DeepMind 《谷歌 收购 的 人 工 智 能 企业 ， 位 于 伦敦 ) 团队 再 度 碾 轧 了 人 


类 的 认 知 。2017 年 12 月 ，DeepMind 团 队 发 布 了 AlphaGo Zero (阿尔 法 
围棋 零 } 。AlphaGo Zero 使 用 了 一 种 叫 作 “强化 学 习 ” 的 机 器 学 习 技 
术 ， 它 只 使 用 了 围棋 的 基本 规则 ， 没 有 使 用 人 类 的 任何 棋谱 经 验 ， 从 
雯 开始 通过 目 我 对 弈 ， 不 断 地 迭代 升级 ， 仅 仅 目 我 对 弈 3 天 后 ， 
AlphaGo Zero 束 以 100: 0 完胜 了 此 前 击败 世界 冠军 李 世 石 的 AlphaGo 
Lee 版 本 。 目 我 对 奔 40 天 后 ，AlphaGo Zero 变 得 更 为 强大 ， 超 过 了 此 前 
击败 当今 围棋 第 一 人 柯 洁 的 AlphaGo Master (大师 版 ) ， 这 人 台 机 器 和 
训练 程序 可 以 横扫 其 他 棋 类 。 经 过 4 个 小 时 的 训练 ， 打 败 了 最 强国 际 象 
棋 AIStockfish，2 个 小 时 打败 了 最 强 将 棋 〈 又 称 为 日 本 象棋 ) AIElmo。 
AlphaGo Zero 证 明了 即使 在 最 具有 挑战 性 的 某 些 领域 , 没有 人 类 
以 往 的 经 验 或 指导 ， 不 提供 基本 规则 以 外 的 任何 领域 的 知识 ， 仅 使 用 
强化 学 习 ， 仅 花费 很 少 的 训练 时 间 机 器 残 能 够 远 远 超越 人 类 的 水 平 。 


机 喜 发 现 了 人 类 无 法 理解 的 知识 


AlphaGo Zero 给 我 们 的 震撼 在 于 人 类 2 000 多 年 来 一 代 代 人 积累 的 
一 项 技艺 在 机 器 眼 里 瞬间 变 得 一 文 不 值 ! 为 什么 会 这 样 ? 围棋 中 的 可 
能 走 法 比 衬 宙 中 的 原子 数 都 多 ， 而 人 类 2 000 多 年 中 高 水 平 对 弈 非常 有 
限 ， 留 下 记录 的 只 有 儿 万 盘 。 这 个 数字 和 所 有 可 能 走 法 比 ， 就 像 太平 
洋 里 的 一 个 水 分 子 。 而 AlphaGo Zero 以 强大 的 计算 能 力 ， 在 很 短 的 时 
间 里 探索 了 大 量 的 人 类 未 曾 探 索 过 的 走 法 。 人 类 下 棋 的 路 径 依赖 性 很 
强 ， 人 生 有 限 ， 想 成 为 高 手 最 稳妥 的 办 法 是 研究 前 人 的 残局 ， 而 不 是 
自己 瞎 摸 索 。 但 AlphaGoZero 在 下 棋 时 ， 不 仅 一 开始 的 决策 是 随机 的 ， 
即使 到 了 大 师 级 后 ， 也 故意 随机 挑选 一 些 决策 ， 跳 出 当前 思路 去 探索 
更 好 的 走 法， 新 发 现 的 许多 制胜 走 法 都 是 人 类 从 未 探索 过 的 ， 这 就 是 
很 多 走 法 让 医 卫 平 大 呼 “ 看 不 懂 ” 的 原因 。 


AlphaGo Zero 给 我 们 的 震撼 在 于 三 个 方面 首先 ， 人 类 能 发 现 的 
知识 和 机 和 妖 能 发 现 的 知识 相 比 ， 惑 像 几 个 小 脚 老 太太 走 过 的 山路 和 几 
百 万 辆 越野 车 开 过 的 山路 。 越 野 车 的 速度 束 是 计算 机 和 AI 心 片 处 理 速 
度 ， 目 前 继续 以 指数 速度 在 提高 。 其 次 ， 和 机 器 可 能 发 现 的 知识 相 
比 ， 人 类 知识 太 人 简单 、 太 幼稚 ， 机 器 谈笑风生 ， 比 人 不 知道 高 到 哪里 
去 了 。 最 后 ， 机 需 发 现 的 知识 不 仅 完 全 超出 了 人 类 的 经 验 ， 也 超出 了 
人 类 的 理性 ， 成 为 人 类 完全 无 法 理解 的 知识 。 

2 500 年 前 最 有 智慧 的 希腊 哲人 苏 格 拉 底 (Socrates， 公 元 前 469 一 
前 399) 终 其 一 生得 出 一 个 结论 : “我 唯一 知道 的 是 我 什么 都 不 知 
道 。” 他 的 学 生 柏 拉 图 (Plato， 公 元 前 427 一 前 347) 认为 我 们 感官 观察 
到 的 世界 只 是 真正 世界 的 影子 而 已 。18 世 纪 伟 大 的 哲学 家 康德 也 仰望 
星空 ， 发 出 了 “我 们 a 到底 能 知道 什么 ”的 千古 之 问 。 但 古代 哲人 只 能 模 
糊 地 感觉 到 人 类 认识 的 局 限 。 今 天 ，AlphaGo Zero 不 仅 清 晰 、 具 体 地 
把 他 们 的 疑虑 变 成 了 铁 的 事实 ， 而 且 先 哲 怎么 也 想不到 人 类 的 认识 能 
力 是 如 此 有 限 ! 

你 会 质疑 说 : 这 不 算 什 么 震撼 吧 ， 人 类 早 或 知道 我 们 已 知 的 很 
， 示 知 的 很 多 。 但 这 个 下 围棋 的 例子 告诉 你 : 已 知 的 是 几 万 副 残 
， 未 知 的 是 103%9 种 可 能 走 法 ， 两 者 相差 几 百 个 数量 级 ! (不 是 几 百 
， 是 几 百 个 数量 级 ， 一 个 数量 级 是 10 倍 。) 

你 学 过 概率 和 统计 ， 继 续 不 服 : 我 们 早 就 知道 组 合 爆炸 。 没 错 ， 
但 我 们 知道 未 知 的 组 合 爆炸 里 有 比 人 类 已 经 获得 的 知识 高 深 得 多 的 知 
识 吗 ? AlphaGo Zero 是 第 一 次 活生生 地 证 明了 这 点 。 听 说 过 火山 爆发 
和 在 现场 看 到 的 感觉 能 一 样 吗 ? 

当然 最 震撼 的 就 是 第 三 个 方面 。 我 们 也 许 知 道 我 们 不 知道 很 多 ， 
甚至 能 用 逻辑 推 新 出 未 知 知识 里 有 比 已 知 知识 更 高 深 的 知识 ， 但 我 们 
怎么 也 想不到 这 些 知 识 是 人 类 根本 无 法 理解 的 。 这 是 人 类 历史 上 第 一 
次 遇 到 这 样 的 问题 ， 我 们 给 目 己 造 了 个 “上 和 帝 ”! 这 件 事 对 哲学 和 认识 
论 的 神 击 空 前 ， 人 类 突然 不 知 所 措 ， 影 响 还 在 发 酵 ， 后 果 不 可 估量。 
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“理解 ”的 意思 是 有 要么 能 用 感觉 把 握 事 物 间 的 关系 ， 要 么 能 用 概念 
把 经 验 表 达 出 来 ， 或 者 用 逻辑 把 事物 间 的 关系 表达 出 来 。 无 法 理解 吏 
等 于 既 无 法 感受 又 无 法 表达 。 

也 就 是 说 ， 机 器 发 现 了 人 类 既 无 法 感受 也 无 法 表达 的 知识 。 用 更 
通俗 的 话说 就是 ， 机 器 发 现 了 那些 既 无 法 “ 意 会 ” 义 无 法 “言传 ”的 知 
识 。 

一 个 无 法 理解 的 知识 的 表现 形式 是 什么 样 的 ? 如 采 无 法 理解 又 怎 
么 判断 它 就 是 知识 ? 当 我 们 想 回 答 上 面 的 问题 时 ， 我 们 发 现 必须 重新 
审视 什么 是 “知识 ”。 人 类 过 去 几 千 年 是 怎样 获得 知识 的 ， 获 得 了 什么 
样 的 知识 ? 束 像 每 次 科学 上 的 重大 发 现 都 要 迫使 我 们 重新 审视 过 去 习 
以 为 第 的 观念 一 样 ， 今 天 机 器 的 震撼 让 我 们 必须 重新 审视 过 去 所 有 关 
于 “知识 ”的 基本 理念 。 

人 类 获得 知识 的 行为 吏 是 认 知 。 过 去 我 们 对 世界 的 认识 局 限 主要 
来 目 观察 能 力 。 在 望远镜 发 现 之 前 ， 第 谷 根本 无 法 观测 行星 运动 ， 当 
然 更 谈 不 上 记录 数据 ， 也 不 会 有 后 来 的 开 普 勒 定 律 和 牛顿 万 有 引力 定 
律 。 在 显微镜 发 明之 前 ， 我 们 不 可 能 发 现 微生物 ， 一 切 关 于 细胞 和 基 
因 的 发 现 都 无 从 谈 起 。 今 天 谁 能 花 1 000 万 美元 买 一 台 冷 冻 电 镜 ， 谁 驶 
可 以 看 到 别人 看 不 到 的 分 子 晶体 结构 ， 就 可 以 经 常 在 《 目 然 》 

(Nature) 杂志 上 发 表 文 章 。 随 着 新 的 观察 仪器 的 出 现 和 已 有 观察 仪 
妖 的 改进 ， 我 们 对 世界 的 认识 还 会 不 断 深入 。 

我 们 对 世界 认识 的 第 二 个 局 限 来 目 解释 能 力 。 所 谓 解 释 能 力 束 是 
发 现 事 物 间 的 因 采 关系 或 者 相关 性 并 能 够 表达 出 来 。 即 使 我 们 能 观察 
到 许多 现象 ， 如 果 我 们 无 法 解释 这 些 现 象 则 还 是 无 法 从 这 些 观察 中 获 
得 知识 。 例 如 第 谷 虽 然 有 大 量 观 测 数据 ， 但 终 其 一 生 没 有 找到 一 个 能 
解释 数据 的 正确 模型 。 又 如 我 们 观察 到 人 有 语言 能 力 而 黑猩猩 没有 ， 
但 不 知道 为 什么 ， 仅 仅 是 知道 这 个 现象 而 已 。 

人 类 几 千 年 来 关于 知识 的 争论 正 古 围绕 着 “观察 ”还 是 “解释 ”展开 
的 。 


理性 主义 和 经 验 主义 之 争 


目 从 5 000 年 前 两 河流 域 的 苏 美 尔 人 发 明了 人 类 最 早 的 文字 一 一 模 
形 文字 以 来 ， 人 类 一 直 在 记录 和 积累 知识 。 但 直到 2 500 年 前 希腊 人 才 
开始 系统 地 人 研究 天 于 知识 的 学 问 。 在 这 个 问题 上 ， 一直 有 两 大 流派 : 
理性 主义 和 经 验 主 义 。 
第 一 个 开局 了 理性 主义 的 人 是 苏 格 拉 底 。 人 类 此 前 的 大 部 分 “ 知 
识 ” 要 么 从 宗教 教义 中 来 ， 要么 从 传统 习俗 中 来 。 人 们 从 生 下 来 束 不 加 
怀疑 地 接受 了 这 些 东 西 。 而 苏 格 拉 抵 则 要 一 一 审视 这 些 东 西 。 苏 格拉 
奈 说 我 们 都 布 望 有 一 个 “好 ”的 人 生 ， 但 到 睁 什么 是 “好 ”什么 
征 “ 坏 ? 呢 ? 不 去 质疑 ， 不 去 深究 你 怎么 知道 呢 ? 所 以 深究 和 道德 是 不 
可 分 割 的 ， 不 去 深 冤 我 们 吴 边 的 世界 不 仅 是 无 知 而 且 是 不 道德 的 ， 所 
以 他 的 结论 是 : 一 个 未 经 深究 的 人 生根 本 吏 不 值得 过 。 他 平时 没事 惑 
中 到 大 街 上 机 住 大 证 问 : 和 公 症 正义 ?下 什 友 是 交 ? 什么 是 
美 ? ”每 当 人 人 们 给 他 个 定义 时 ， 他 都 能 举 出 一 个 反例 。 他 这 种 深究 思辩 
影响 了 无 数 代 人 。 后 来 当 他 的 学 生 相 拉 图 把 “< 人 ”定义 为 “没有 毛 的 双 足 
动物 ”时 ， 当 时 的 另 一 位 哲学 家 提 奥 奇 尼 斯 马上 拿 来 一 只 拔 光 了 毛 的 鸡 
说 : “大 家 请 看 柏拉图 的 人?! ”经 过 一 生 的 深究 ， 苏 格拉 底 得 出 结 
论 “ 我 唯一 知道 的 古 我 什么 也 不 知道 ”。 苏 格 拉 底 式 思辨 震撼 了 当时 的 
社会 ， 传 统 势 力 认 为 这 样 会 搞 乱 人 心 ， 当 政 者 用 “腐蚀 青年 思想 罪 ” 判 
处 他 死刑 ， 他 最 终 饮 毒 酒 喘 亡 。 他 一 生 全 部 用 来 和 人 辩论 ， 没 有 留 下 
任何 著作 。 六 亏 他 的 学 生 相 拉 图 把 老师 的 辩论 编辑 成 了 传世 之 作 《 对 
话 录 》。 正 古 苏 格拉 确 开 启 了 通过 逻辑 思辨 来 验证 知识 的 希腊 传统 。 
如 果 说 是 苏 格 拉 诬 开 了 理性 主义 的 移 河 ， 他 的 弟子 柏拉图 惑 是 理 
性 主义 集大成 的 鼻祖 。 共 格拉 底 的 思辩 主要 集中 在 道德 哲学 领域 ， 探 
究 什 么 是 “公平 "和 “用 *”。 而 柏拉图 则 对 他 的 先 硬 毕 达 哥 拉 斯 
(Pythagoras， 约 公元 前 570 一 前 495) 开创 的 数学 传统 深 为 折服 。 柏 拉 
图 的 学 说 深 受 数学 严格 推理 的 影响。 他 甚至 在 他 创办 的 学 襄 门 口 挂 了 


个 牌子 :“ 不 懂 几 何者 不 得 入 内 。” 柏 拉 图 学 说 的 核心 是 “理想 原型 ”。 
他 说 ， 世 界 上 每 一 条 狗 都 不 一 样 ， 我 们 为 什么 认为 它们 都 是 狗 ? 人 类 
心中 一 定 早 有 一 个 关于 狗 的 理想 原型 。 我 们 知道 三 角形 的 内 角 之 和 等 
于 180 度 ， 但 我 们 从 未 见 过 一 个 完美 的 三 角形 。 他 认为 人 类 的 感官 无 法 
触及 这 些 理想 原型 ， 我 们 能 感受 到 的 只 是 这 些 理想 原型 的 失真 拷贝 。 
真实 世界 就 像 润 六 外 的 一 匹 蕊 ， 人 类 就 像 一 群 背 对 着 洞口 的 润 信 人 ， 
只 能 看 到 这 匹 马 在 洞 六 壁 上 的 投影 。 柏 拉 图 奠定 了 理性 主义 的 两 大 基 
础 一 一 知识 〈 理 想 原 型 ) 是 天 生 的 ; 感官 是 不 可 靠 的 ， 并 由 此 推出 理 
性 主义 的 结论 : 推理 而 不 是 观察 ， 才 是 获取 知识 的 正确 方法 。 

亚 里 士 多 德 (Aristotle， 公 元 前 384 一 前 322) 17 岁 进入 柏拉图 的 学 
宫 当 学 生 ， 当 时 柏拉图 已 经 60 罗 了 。 亚 里 士 多 德 在 学 宫 里 得 了 20 年 ， 
直到 他 的 老师 柏拉图 去 世 。 亚 里 士 多 德 对 老师 非常 尊敬 ， 但 他 完全 不 
同意 老师 的 “理想 原型 ”是 先天 的 。 他 认为 每 一 条 狗 都 带 有 狗 的 属性 ， 
观察 了 许多 狗 之 后 就 会 归纳 出 狗 的 所 有 属性 。 这 个 “理想 原型 ”完全 可 
以 通过 后 天 观察 获得 ， 而 不 需要 什么 先天 的 假设 。 柏 拉 图 酷爱 数学 ， 
而 亚 里 士 多 德 喜 欢 到 自然 中 去 观察 植物 和 动物 。 两 人 的 喜好 和 经 历 是 
他 们 产生 分 歧 的 重要 原因 之 一 。 亚 里 士 多 德 认 为 : 知识 是 后 天 获得 
的 ， 只 有 通过 感官 才能 获得 知识 。 正 是 亚 里 士 多 德 开 了 经 验 主义 的 先 
河 。 

经 验 主 义 这 一 派 后 世 的 著名 代表 人 物 有 英国 的 洛克 (John 
Locke，1632 一 1704) ， 贝 克 莱 (George Berkeley，1685 一 1753) 和 休 
席 (David Hume，1711 一 1776) ， 贝 克 莱 认 为 人 生 下 来 是 一 张 白 纸 ， 
所 有 的 知识 都 是 通过 感官 从 经 验 中 学 来 的 。 但 理性 主义 则 认为 ， 经 验 
根本 不 可 靠 。 英 国 哲学 家 罗素 (Bertrand Russell，1872- 一 1970) 有 个 
著名 的 “ 火 鸡 经 验 论 ”。 火 鸡 从 生 下 来 每 天 都 看 到 主人 哼 着 小 曲 来 喂 
食 ， 于 是 就 根据 经 验 归 纳 出 一 个 结论 : 以 后 每 天 主人 都 会 这 样 。 这 个 
结论 每 天 都 被 验证 ， 火 鸡 对 自己 的 归纳 总 结 越 来 越 自 信 ， 直 到 感恩 市 
的 前 一 天 晚上 被 主人 军 杀 。 理 性 主义 者 还 问 : 眼见 为 实 吗 ? 你 看 看 图 
1.1 中 的 横 线 是 水 平 的 还 是 倾斜 的 ? 


图 1.1 视 错觉 图 (图 中 所 有 横 线 都 是 水 平 的 ) 


理性 主义 的 后 世代 表 人 物 则 有 法 国 的 笛 卡 儿 (Rene Descartes， 

1596 一 1650) 和 德国 的 莱 布 尼 沈 (Gottfried Leibniz，1646 一 1716) 

笛 卡 儿 有 名 名言“ 我 思 ， 故 我 在 "， 我 的 存在 这 件 事 不 需要 经 验 ， 不 需 
要 别人 教 我 ， 我 天 生 知道 。 莱 布 尼 将 是 和 和 牛顿 一 样 的 天 才 ， 他 和 和 牛顿 
同时 发 明了 微 积 分 ， 也 是 二 进 制 的 发 明 人 ， 还 发 明了 世界 上 第 一 台 手 
播 计算 器 。 他 认为 世界 上 每 个 事物 都 包含 了 定义 这 个 事物 的 所 有 特 
性 ， 其 中 也 包含 了 和 其 他 事物 的 关系 。 从 理论 上 我 们 可 以 用 推理 的 方 
法 预测 全 宇宙 任何 一 点 ， 过 去 和 未 来 任何 时 间 的 状态 。 包 


理性 主义 认为 ， 感官 根本 不 靠 谱 ， 最 可 靠 的 古 理 性 ， 基 于 公理 严 
格 推 导出 来 的 几何 定理 永远 都 不 会 错 。 理 性 主义 找 出 更 多 的 例子 来 说 
明 人 类 的 最 基本 的 概念 是 天 生 的 。 例 如 目 然 数 ， 我 们 怎么 学 会 “1” 这 个 
概念 的 ? 拿 了 一 个 苹 采 告诉 你 “这 征 一 个 苹果 ” 又 给 你 年 了 个 橘子 告 
诉 你 “这 是 一 个 桶 子 ”。 但 苹果 是 苹果 ， 橘 子 是 桶 于 ， 两 者 没关系 ， 你 
怎么 就 能 抽象 出 “1” 这 个 概念 来 呢 ? 又 比如 我 们 可 以 根据 直角 三 角形 的 
特点 推导 出 勾 股 定理 ， 又 进一步 发 现世 界 上 居然 有 无 法 用 分 数 表 达 的 


无 理 数 。 这 种 章 命 性 的 发 现 完全 不 依赖 感觉 和 经 验 。 小 孩 一 出 生 束 知 
道 这 个 球 不 是 那个 球 ， 这 条 狗 不 是 那 条 狗 ， 这 个 “同一 性 ?是 理解 世界 
最 基本 的 概念 ， 没 人 教 他 。 

我 们 注意 到 理性 主义 有 一 个 隐 伟 的 假设 ,就 古 因果 关系 。 在 莱 布 
尼 次 的 世界 里 ， 一 件 事 会 导致 男 外 一 件 事 ， 所 以 才 有 可 能 推 性 。 经 验 
主义 当然 不 服 ， 体 误 融 问 ， 一 件 事 发 生 在 另外 一 件 事 之 后 ， 两 者 未 必 
有 因 末 关系 。 壁 如 我 把 两 个 曾 钟 一 个 设 在 6:00， 一 个 设 在 6:01， 能 说 后 
面 的 铃声 啊 了 是 前 一 个 造成 的 吗 ? 理性 主义 不 仅 认 为 事物 间 有 因 末 关 
系 ， 而 且 认 为 通过 逻辑 推理 可 以 得 到 很 多 知识 。 辟 如 归纳 推理 ， 太 阳 
每 天 早上 都 会 升 起 。 但 休 误 束 质 问 : 你 能 像 证 明 数 学 定理 一 样 证 明太 
阳 明 天 会 升 起 吗 ? 不 能 吧 。 那 能 观察 吗 ? 明天 还 没 到 来 显然 不 能 观 
察 ， 那 你 插 什 么 说 明天 太阳 一 定 升 起 ， 我 要 说 明天 不 一 定 升 起 错 在 哪 
里 了 ? 我 们 看 到 休 误 挑战 的 是 归纳 背后 的 假设 .事物 运动 规律 不 变 ， 
在 这 里 就 是 说 地 球 和 太阳 系 的 运动 不 会 改变 。 休 谍 最 后 说 ， 物 理 世界 
没什么 因果 ， 没 什么 必然 ， 你 最 多 能 根据 以 往 的 经 验 告 诉 我 : 明天 后 
上 太阳 还 可 能 升 起 。 


这 两 派 人 17 世纪 吵 到 18 世 纪 ， 这 时 候 在 德国 偏僻 的 海德 堡 出 现 了 
一 个 小 个 子 乡村 秀才 。 他 说 ， 你 们 双方 似乎 都 有 道理 ， 我 来 整合 一 下 
看 看 。 他 就 是 哲学 史上 最 有 影响 力 的 康德 (Immanuel Kant，1724 一 
1804) 。 康 德 说 ， 没 错 ， 我 们 当然 要 通过 感官 去 理解 世界 。 但 我 们 对 
事物 的 理解 包括 这 个 事物 的 具体 形态 和 它 的 抽象 概念 。 壁 如 眼前 这 本 
书 ， 一 本 书 的 具体 形态 千变万化 ， 但 “ 书 ” 这 个 概念 就 是 指 很 多 页 有 字 
的 纸 装订 在 一 起 的 一 个 东西 。 我 们 说 “面前 有 这 本 书 ” 的 意思 到 底 是 什 
么 ? 那 至 少 要 说 现在 几 月 几 日 几 点 几 分 ， 在 某 市 某 区 某 小 区 几 号 楼 几 
号 房间 的 哪个 桌子 上 有 这 本 书 ， 也 就 是 理解 一 个 具体 的 东西 离 不 开 时 
间 和 空间 的 概念 。 但 谁 教 给 你 时 间 和 空间 了 ? 你 妈 从 小 教 过 你 吗 ? 你 
教 过 你 孩子 吗 ? 好 像 都 没有 ， 我 们 好 像 天 生 就 懂 。 所 以 康德 说 ， 你 
看 ， 必 须 有 这 些 先 天 就 有 的 概念 你 才能 理解 世界 。 我 们 好 像 天 然 知 
道 “ 书 ”是 个 “东西 >, “东西 ?是 一 种 不 依赖 我 们 的 独立 存在 。 谁 教 给 我 


们 “东西 ”这 个 概念 的 ? 没入， 好 像 又 是 天 生 吏 惟 吗 ? 康德 整合 了 经 验 
主义 和 理性 主义 ， 他 的 一 名 名言 是 “没有 内 容 的 思维 征 空 洞 的 ， 没 有 概 
念 的 感知 是 盲目 的。 只 有 把 两 者 结合 我 们 才能 认识 世界 ”。 


在 2 500 年 的 辩论 中 ， 经 验 主义 当然 不 会 否认 数学 中 通过 严格 推理 
得 出 来 的 结论 的 可 靠 性 ， 理 性 主义 也 不 得 不 承认 认 知 物理 世界 离 不 开 
感官 。 那么 这 场 打 了 2 500 年 的 嘴 仗 到 搬 在 争 什 么 呢 ? 问题 出 在 理性 主 
义 者 企图 把 数学 世界 里 证 明定 理 这 样 的 绝对 可 靠 性 推广 到 物理 世界 ， 
也 即 他 们 企图 找到 一 个 检验 知识 的 普 遇 的 标准 ， 能 够 适用 于 所 有 领 
域 。 数 学 (例如 几何 学 ) 是 建构 在 公理 之 上 的 一 个 自治 而 完备 的 系统 
(至 少 对 自然 数 和 几何 是 如 此 ) 。 所 谓 自治 就 是 说 ， 在 这 个 系统 里 只 
要 从 公理 出 发 吏 不 会 推导 出 互相 刻 盾 的 结论 ;所谓 完备 吏 是 说 ， 在 这 
个 系统 里 任何 一 个 命题 都 是 可 以 证 实 或 证 仿 的 。 而 亚 里 士 多 德 时 代 的 
目 然 科 学 的 可 靠 性 判断 标准 是 “观察 与 模型 符合 ?"， 即 观察 到 的 目 然 现 
象 和 事先 假设 的 模型 的 预测 结 采 相符 合 。 这 种 物理 真实 性 的 判断 标准 
和 数学 中 的 判断 标准 完全 不 同 。 所 以 经 验 主义 觉得 硬 要 把 数学 中 的 可 
靠 性 标准 所 到 目 然 科 学 中 来 不 适用 ， 或 者 说 经 验 主 义 认 为 在 目 然 科学 
领域 只 能 依赖 感官 。 因 此 这 场 争 论 是 不 对 称 的: 理性 主义 要 从 数学 攻 
入 目 然 科学 ， 而 经 验 主义 死守 目 然 科学 的 阵地 。 两 方 手 扯 不 清 的 男 一 
个 原因 古 谁 都 不 知道 感官 和 认 知 的 本 质 是 什么 ， 或 者 说 知识 的 本 质 是 
什么 。 双 方 根据 目 己 的 猜测 和 假设 激烈 准 论 ， 一 直到 20 世 纪 50 年 代 人 
们 对 大 脑 的 研究 才 取 得 突破 。 


知识 的 生物 学 基础 一 一 神经 元 连接 


你 会 发 现 ， 所 有 认 知 的 基础 都 是 记忆 ， 如 有 果 没 有 记忆 的 能 力 ， 观 
察 、 理 解 、 推 理 、 想 象 等 其 他 所 有 认 知 行为 都 不 会 存在 ， 甚 至 不 会 有 
情绪 。 一 个 患 阿尔 次 海 默 病 的 人 ， 面 部 甚至 逐渐 失去 表情 。 人 类 胎儿 


在 30 周 后 束 开 始 了 最 初 的 记忆 ， 归 儿 从 刚 生 下 束 能 分 辨 出 母 杀 的 声音 
了 。 

如 果 认 知 的 基础 是 记 忆 ， 那 么 记忆 的 基础 又 是 什么 呢 ? 你 仔细 想 
想 ， 记 忆 其 实 束 是 一 种 关联 。 你 在 学 “o" 这 个 字母 时 ， 有 是 把 一 个 圆圈 的 
图 像 和 一 个 “ 欧 ?” 的 发 音 关 联 起 来 。 那 这 种 关联 在 大 脑 中 是 如 何 形成 的 
呢 ? 

这 种 关联 是 通过 我 们 大 脑 中 神经 元 之 间 的 连接 形成 的 。 大 脑 有 大 
约 1 000 亿 个 神经 元 ， 一 个 神经 元 可 以 从 许多 其 他 神经 元 接收 电 脉冲 信 
号 ， 同 时 也 同 其 他 神经 元 输出 电信 和 号。 

如 图 1.2 所 示 ， 每 个 神经 元 都 能 输出 和 接收 信和 号。 人 负 员 输出 的 一 端 
叫 “ 轴 突 ”， 负 责 接 收 的 一 端 叫 “ 树 突 ”。 每 个 神经 元 都 有 几 千 个 树 突 ， 
人 负责 从 不 同 的 神经 元 接收 信号 。 同 样 ， 每 个 神经 元 的 输出 信号 可 以 传 
给 和 它 相 连 的 几 千 个 神经 元 。 那 么 这 个 最 初 的 信号 是 从 哪里 来 的 呢 ? 
通常 都 来 自 感 觉 细 胞 ， 如 视 沉 细胞、 听觉 细 胞 等 。 
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图 1.2 大 脑 神经 元 和 突 触 的 结构 


图 片 来 源 : https://www.researchgate.net/figure/Generic-neurotransmitter- 
system figl_ 318305870。 


那 神经 元 之 间 是 怎么 连接 的 呢 ? 一 个 神经 元 的 轴 突 和 另外 一 个 神 
经 元 的 树 突 之 间 有 20 纳 米 (一 根 头 发 丝 的 /2 000) 的 小 颖 除 ， 这 个 缝 
际 叫 “ 突 触 *”。 图 1.2 的 右 半 部 分 束 是 放大 了 的 突 触 。 它 保证 了 两 个 神经 
元 各 自 独 立 ， 不 会 粘 在 一 起 。 记 忆 的 主要 奥秘 就 藏 在 这 里 。 在 这 个 连 
接 的 地 方 前 一 个 神经 元 的 电信 号 会 转化 成 化 学 物质 传递 到 下 个 神经 
元 ， 下 个 神经 元 接收 到 化 学 物质 后 又 会 再 转 成 电信 号 。 不 同 的 突 触 面 
积 大 小 不 同 ， 化 学 物质 的 传递 速度 和 量 不 同 ， 因 而 造成 有 些 突 触 是 “ 千 
合 神 离 ”， 相 互 之 间 并 没有 电信 和 号 通过 ;， 有 些 则 是 “党 来 常 往 >， 经 常 有 
信号 通过 。 

你 一 定 听 说 过 俄国 生理 学 家 巴 甫 洛 夫 (Ivan Pavlov，1849 一 
1936) 的 条 件 反 射 实 验 。 受 到 条 件 反 射 的 启发 ， 加 拿 大 心理 学 家 赫 布 
(Donald Hebb，1904 一 1985) 在 1949 年 提出 了 一 个 大 胆 的 猜想 。 他 认 
为 当 大 脑 中 两 个 神经 元 同时 受到 刺激 时 ， 它 们 之 间 就 会 建立 起 连接 ， 
以 后 其 中 一 个 神经 元 被 激发 时 会 通过 连接 让 另 一 个 神经 元 也 被 激发 。 
壁 如 在 巴 甫 洛 夫 对 狗 的 实验 中 ， 送 食物 的 时 候 同 时 摇 铃 ， 摇 铃 刺激 了 
听觉 神经 元 ， 食 物 味道 刺激 了 嗅觉 神经 元 并 且 导 致 分 泌 唾 液 ， 听 觉 和 
视觉 神经 元 同时 受到 刺激 ， 它 们 之 间 就 建立 了 连接 ， 一 个 神经 元 的 激 
会 导致 男 一 个 神经 元 的 激发 。 经 过 多 次 反复 ， 它 们 的 连接 会 越 来 越 
稳定 。 以 后 即使 没有 送 食 物 ， 狗 只 要 听 到 揪 铃 就 像 闻 到 食物 一 样 会 分 
泌 唾 液 。 人 也 是 一 样 ， 比 如 说 一 个 小 孩 被 火 资 过 一 次 就 能 
把 “< 火 和“ 疼 ”联系 起 来 。 当 小 孩 看 见 火 时 ， 他 大 脑 中 负责 接收 视觉 信 
号 的 神经 元 被 激发 了 ， 与 此 同时 他 的 手感 觉 到 次 ， 于 是 他 大 脑 中 负责 
接收 皮肤 感觉 细胞 的 神经 元 也 被 激发 了 。 如 果 看 到 火 和 感觉 到 疼 这 两 
件 事 同时 发 生 ， 那 么 这 两 个 神经 元 细胞 就 连通 了 ， 也 就 是 有 信和 号 通过 
了 。 下 次 这 个 孩子 见 到 火 ， 马 上 会 想到 疼 ， 因 为 当 负责 看 到 火 的 神经 
元 被 激发 后 ， 马 上 会 把 信号 传 给 负责 “ 疼 ” 这 种 感觉 的 神经 元 ， 就 能 让 
小 孩 想 到 疫 。 刺 激越 强 ， 神 经 元 的 连接 就 越 稳 固 。 孩 子 被 火 次 过 一 次 


手 束 永远 记 住 了 ， 再 也 不 会 去 探 火 ， 有 些 刺激 很 弱 ， 连 接 束 不 稳固 ， 
长 时 间 不 重复 殊 会 断 开 。 例 如 背 英 文 单词 ， 重 复 的 刺激 越 多 ， 信 号 的 
传递 速度 就 越 快 。 比 如 一 个 篮球 运动 员 对 飞 过 来 的 篮球 的 反应 比 普 通 
人 快 很 多 ， 一 个 空军 飞行 员 对 飞机 姿势 和 敌人 导弹 的 反应 部 比 普通 人 
快 ， 这 些 都 是 反复 训练 出 来 的 。 所 谓 赫 布 狂想， 本 质 上 是 通过 建立 神 
经 元 之 间 的 连接 从 而 建立 起 不 同事 物 之 间 的 联系 。 后 来 这 个 猜想 被 科 
学 家 反复 证 实 ， 就 成 了 现在 我 们 常 说 的 赫 布 学 习 定律 。 

区 布 定律 的 示 了 记忆 或 者 说 关联 的 微观 机 制 ， 局 发 了 好 几 代 计算 
机 科学 家 ， 他 们 开始 用 电子 线路 模仿 神经 元 ， 然 后 用 许多 电子 神经 元 
搭建 越 来 越 大 的 神经 元 网 络 ， 今 天 这 些 神 经 网 络 的 记忆 和 关联 能 力 已 
经 远 远 超过 了 人 人类， 许多 机 器 的 “ 神 迹 ”大 都 源 于 这 种 超 强 的 记忆 和 关 
联 能 力 。 在 第 三 章 ， 我 们 会 介绍 为 什么 神经 网 络 的 超 强 记忆 和 关联 能 
力 会 转化 为 不 可 思议 的 “超人 ”能 力 。 

这 些 在 大 脑 中 由 神经 元 的 连接 形成 的 关联 记忆 又 可 以 分 为 两 类 : 
可 表达 的 和 不 可 表达 的 。 


可 表达 的 “明知 识 ” 


目前 ， 脑 神经 科学 的 最 新 研究 发 现 ， 可 表达 的 记忆 并 不 是 对 应 着 
一 组 固定 神经 元 的 连接 ， 而 是 大 致 地 对 应 于 散布 在 大 脑 皮 层 各 处 的 一 
些 连接 。 原 因 征用 来 表达 的 语言 和 文字 只 能 是 体验 的 概括 和 近似 。 这 
类 可 以 用 语言 表达 或 数学 公式 描述 的 知识 就 古人 类 积 烷 的 大 量 “ 正 式 知 
识 ”， 也 可 以 称 为 “明知 识 *”。 它们 记载 在 书籍 、 洒 志 、 文 章 、 首 频 等 
种 媒体 上 。 

要 想 把 某 种 关联 表达 出 来 ， 人 类 唯一 的 方法 十 通过 语言 和 符号 。 
语言 和 符号 表达 的 第 一 个 前 所 是 要 有 概念 。 所 谓 概念 台 征 某 个 特定 的 
发 首 或 符号 稳定 地 对 应 于 一 个 事物 或 行为 。 大 部 分 的 名 词 和 动词 都 古 


这 样 的 概念 。 第 二 个 前 提 是 每 个 概念 都 不 同 于 其 他 概念 ， 猫 就 是 猫 
狗 就 是 狗 ， 不 能 把 猫 叫 成 狗 ， 或 者 把 狗 叫 成 猫 ， 两 者 要 能 区 分 开 。 这 
“同一 律 "。 第 三 个 前 提 是 猫 不 能 同时 也 不 是 猫 ， 黑 不 能 同时 也 是 
白 。 这 叫 < 不 矛盾 律 "。 有 了 这 些 基本 前 提 ， 根 据 已 知 的 事物 间 的 关系 
我 们 就 可 以 推导 出 新 的 知识 或 者 论证 一 个 决定 的 合理 性 。 推 理 、 候 
设 、 联 想 ， 这 些 本 质 上 都 是 建立 在 语言 之 上 的 思维 活动 ， 没 有 语言 就 
完全 无 法 思维 。 所 有 的 正常 思维 都 要 借助 概念 ， 要 遵循 < 同一 律 "和 “不 
矛盾 律 *。 语 言 是 人 类 和 所 有 动物 的 最 大 区 别 。 黑 猩猩 可 以 学 会 很 多 概 
念 ， 璧 如 "我 ”“ 吃 ”和 * 香 莹 "等 ， 但 无 论 实验 人 员 如 何 训练 黑猩猩 ， 它 
们 都 无 法 组 合 出 “我 要 吃香 藻 * 这 样 的 句子 。 人 的 语言 能 力 的 本 质 是 什 
么 ? 它 的 生物 学 基础 是 什么 ? 语言 和 自我 意识 是 什么 关系 ? 目前 这 些 
都 还 不 清楚 。 但 我 们 知道 ， 人 类 语言 是 不 精确 的 ， 越 基本 的 概念 越 不 
容易 定义 清楚 ， 像 公平 "理性 "等 。 人 类 语言 中 有 大 量 含混 和 歧义 的 
表述 ， 像 今天 骑 车 子 差点 滑 倒 ， 幸 亏 我 一 把 把 把 把 住 了 "。 

英国 哲学 家 罗素 企图 把 语言 建立 在 精确 的 罗 辑 基础 之 上 ， 他 用 了 
几 百 页 纸 的 篇 幅 来 证 明 1+1=2。 德 国 哲学 家 维特 根 斯 坦 (Ludwig 
Wittgenstein，1889 一 1951) 认为 人 类 有 史 以 来 几乎 所 有 的 哲学 辩论 都 
源 于 语言 的 模糊 不 清 ， 因 而 没有 任何 意义 。 他 认为 在 世界 中 只 有 事实 
有 意义 ， 在 语言 中 只 有 那些 能 够 判断 真 伪 的 论断 才能 反映 事实 。 他 的 
结论 是 ， 我 们 的 语言 受 限 ， 因 而 我 们 的 世界 受 限 。 

为 什么 语言 的 表达 能 力 受 限 ? 用 信息 论 的 方法 可 以 看 得 很 清楚 。 
我 们 大 脑 接收 的 环境 信息 量 有 多 大 ? 一 棵 树 、 一 块 石头 、 一 条 狗 都 包 
含 几 十 MB ( 光 字 节 ) 甚至 几 十 GB ( 千 兆 字 节 ) 的 数据 ， 我 们 的 感觉 
接收 神经 元 虽然 大 大 简化 了 这 些 信息 ， 但 它们 向 大 脑 传导 的 信息 量 仍 
然 非常 大 ， 表 1.1 是 各 个 感觉 器 官 每 秒 钟 能 向 大 脑 传递 的 信息 量 。 

表 1.1 人 体 各 个 感官 向 大 脑 传 送信 息 的 速率 


10 000 000 


1 000 000 


100 000 


100 000 


1 000 


资料 来 源 : https://www.britannica.com/science/information-theory/Physiology 。 

大 脑 存储 这 些 信 息 的 方式 是 神经 元 之 间 的 连接 ， 大 脑 在 存储 时 可 
能 进一步 简化 了 这 些 信息 ， 但 它们 的 信息 量 仍 然 远 远大 于 我 们 语言 所 
能 表达 的 信息 量 。 人 类 语言 的 最 大 限制 是 我 们 的 舌头 每 秒 钟 只 能 嘟 蛤 
那么 几 下 ， 最 多 表达 几 十 个 比特 的 意思 。 (比如 读书 ， 我 们 平均 每 分 
钟 能 读 300 字 ， 每 秒 读 5 个 字 =40 比 特 。) 这 样 大 脑 接收 和 存储 的 信息 
与 能 用 语言 表达 出 来 的 信息 量 殊 有 6 个 数量 级 的 差别 。 也 束 是 说 极为 丰 
富 的 世界 只 能 用 极为 贫乏 的 语言 表达 。 许 多 复杂 事物 和 行为 只 能 用 位 
化 了 的 概念 和 你 辑 表 达 。 这 整 古 人 类 语言 的 基本 困境 。 


只 可 意 会 的 “ 默 知识 ” 


由 于 舌头 翻 卷 速 度 严 重 受 限 ， 以 神经 元 连接 形式 存在 大 脑 中 的 人 
类 知识 只 有 极 少 一 部 分 可 以 被 表达 出 来 。 而 绝 大 部 分 知识 无 法 用 语言 
表达 ， 如 骑马 、 打 铁 、 骑 自行 车 、 众 棋 书 画 ， 察 言 观 色 、 待 人 接 物 、 
判断 机 会 和 危险 等 。 这 些 知识 由 于 无 法 记录 ， 所 以 无 法 传播 和 积累 ， 
更 无 法 被 集中 。 灿 籍 犹太 裔 科学 家 、 哲 学 家 波兰 尼 (Michael 
Polyani，1891 一 1976) 称 这 些 知识 为 “ 默 会 知识 ”或 者 “ 默 知识 ”。 波 兰 
尼 举 了 骑 自 行车 的 例子 。 如 果 你 问 每 个 骑 自 行车 的 人 是 怎么 保持 不 倒 


的 ， 回 答 会 是 “车 往 哪 边 个 ， 就 往 哪 边 打车 把 ”。 从 物理 学 上 可 以 知 
道 ， 当 朝 一 个 方向 打 把 时 会 产生 一 个 相反 方向 的 离心 力 让 车 子平 衡 。 
甚至 可 以 精确 计算 出 车 把 的 转弯 半径 应 该 和 速度 的 平方 成 反比 。 但 哪 
个 骑 自 行车 的 人 能 够 知道 骑 车 的 速度 呢 ? 即使 知道 谁 又 能 精确 地 把 转 
这 半径 控制 在 速度 平方 的 反比 呢 ? 所 有 骑 自行 车 的 人 都 是 赁 身体 的 平 
衡 感觉 左 一 把 右 一 把 地 曲折 前 进 。 世 界 上 大 概 没有 一 个 人 学 骑 自 行车 
是 看 手册 学 会 的 ， 事 实 上 也 没有 这 样 的 学 习 手册 。 大 部 分 技能 类 的 知 
识 都 类 似 。 

默 知识 和 明知 识 主 要 有 以 下 四 点 区 别 : 

(1) 默 知识 无 法 用 语言 和 文字 描述 ， 因 此 不 容易 传播 ， 无 法 记录 
和 积累 ， 只 能 靠 师 传 带 徒弟 。 像 大 量 的 传统 工艺 和 技能 ， 如 果 在 一 代 
人 的 时 间 里 没 人 学 习 就 会 从 历史 上 彻底 消失 。 

(2) 获取 默 知识 只 能 靠 闲 身体 验 ， 传 播 只 能 筷 人 与 人 之 间 紧密 的 
互动 (你 第 一 次 骑 自行 车 时 你 爸 在 后 面 扶 着 ) 。 而 这 种 互动 的 前 提 是 
相互 信任 (你 不 敢 让 陌生 人 教 你 骑 自 行车 ) 。 获 得 默 知识 必须 有 反馈 
回路 ( 骑 自 行车 摔 了 中 就 是 姿势 错 了 ， 不 摔跤 就 是 姿势 对 了 ) 。 

(3) 默 知识 散布 在 许多 不 同人 的 身上 ， 无 法 集中 ， 很 难 整合 ， 要 
想 使 用 整合 的 默 知 识 需要 一 群 人 紧密 协调 互动 。 由 于 无 法 言传 ， 所 以 
协调 极为 困难 (比如 杂技 过 罗汉 ) 。 

(4) 默 知识 非常 个 人 化 。 每 个 人 对 每 件 事 的 感觉 都 是 不 同 的 ， 由 
于 无 法 表达 ， 因 而 无 法 判断 每 个 人 感觉 的 东西 是 否 相同 。 


基于 对 默 知识 的 理解 ， 奥 地 利 经 济 学 家 哈 耶 克 (Friedrich Hayek， 
1899 一 1992) 论证 了 市 场 是 最 有 效 的 资源 配置 形式 。 因 为 市 场 上 的 每 
个 人 都 有 自己 不 可 表达 的 、 精 微 的 偏好 和 细腻 的 需求 ， 而 且 没 人 能 够 
精确 完整 地 知道 其 他 人 的 偏好 和 需求 ， 也 就 是 说 供需 双方 实际 上 无 法 
直接 沟通 。 供 需 双 方 最 简洁 有 效 的 沟通 方式 就 是 通过 商品 的 价格 。 在 
自由 买卖 的 前 提 下 ， 市 场 中 每 个 人 只 要 根据 价格 信号 就 可 以 做 出 决 


定 。 价 格 可 以 自动 达到 一 个 能 够 反映 供需 双方 偏好 和 需求 的 均衡 点 。 
一 个 价格 数字 ， 就 把 供需 双方 的 无 数 不 可 表达 的 信息 赛 括 其 中 。 这 
种 “沟通 ”何其 简洁 ， 这 种 “协调 * 何 其 有 效 ， 这 种 自发 形成 的 秩序 何其 
自治 。 哈 耶 克 根据 同样 的 道理 论证 了 国家 或 政府 永远 都 无 法 集中 这 些 
不 可 表达 的 分 散 信 息 。 

在 机 器 学 习 大 规模 使 用 之 前 ， 人 类 对 于 默 知识 没有 系统 研究 。 但 
现在 我 们 发 现 机 器 非常 擅长 学 习 默 知识 。 这 就 给 我 们 提出 了 三 个 严肃 
的 问题 。 

(1) 默 知 识 在 所 有 知识 中 占 比 有 多 大 ? 

(2) 默 知识 在 人 类 社会 和 生活 中 有 多 大 用 处 ? 

(3) 如何 使 用 默 知识 ? 

第 一 个 问题 的 简单 粗暴 的 回答 是 默 知 识 的 量 远 远大 于 可 陈述 的 明 
知识 。 原 因 是 事物 的 状态 很 多 是 难以 观察 的 ， 更 多 是 不 可 描述 的 。 人 
类 的 描述 能 力 非常 有 限 ， 只 限于 表达 能 力 极 为 有 限 的 一 维 的 语言 文 
字 。 在 所 有 已 经 产生 的 信息 中 ， 文 字 只 占 极 少 的 比例 ， 大 量 的 信息 以 
图 片 和 视频 方式 呈现 。 人 类 现代 每 年 产生 的 各 种 文字 大 约 是 160TB。 
世界 最 大 的 美国 国会 图 书馆 有 2 000 万 册 书 ， 几 乎 涵盖 了 人 类 有 上 史 以 来 
能 够 保存 下 来 的 各 种 文字 记录 ， 就 算 每 本 书 有 100 万 字 ， 这 些 书 的 总 信 
息 量 也 只 有 20TB。 而 目前 用 户 每 分 钟 上 传 到 YouTube 的 视频 是 300 小 
上 时， 每 小 时 视频 算 1GB， 每 年 上 传 的 量 就 是 157 680TB。 如果 把 每 个 人 
手机 里 的 视频 都 算 上 ， 那 么 视频 信息 是 文字 信息 的 上 亿 倍 。 今 后 这 个 
比例 还 会 不 断 加 大 。 虽 然 这 些 视 频 或 图 片 都 是 “信息 ”， 还 不 是 “ 知 
识 ”， 但 我 们 也 可 以 想象 从 视频 图 片 中 能 提取 出 的 隐藏 的 相关 性 的 量 一 
定 远 远 大 于 所 有 的 文字 知识 。 

有 了 第 一 个 问题 的 答案 ， 就 容易 回答 第 二 个 问题 。 很 显然 ， 用 机 
回 学 习 从 视频 和 图 片 中 萃取 知识 是 人 类 认识 世界 的 一 个 新 突破 ， 只 
有 办 法 把 事物 状态 用 图 片 或 视频 记录 下 来 ， 就 有 可 能 从 中 萃取 出 知识 


来 。 如 果 视 频 和 图 片 的 信息 量 是 文字 的 上 亿 倍 ， 那 么 我 们 有 理由 期 待 
从 中 茎 取出 的 知识 呈 爆 炸 式 增长 ， 在 社会 和 生活 中 起 到 关键 甚至 主导 
作用 。 人 工 智能 通过 观看 大 量 人 类 历史 上 的 影视 作品 ， 可 以 归纳 提取 
出 影视 中 的 经 典 桥 段 ， 创 作出 新 颖 的 配乐 、 台 词 和 预告 片 ， 供 人 类 借 
鉴 或 使 用 。2016 年 ，IBM (国际 商业 机 器 公司 ) 的 沃 森 系 统 为 二 十 世 
纪 福 克 斯 电影 公司 的 科幻 电影 《摩根 》 (Morgan) 制作 了 预告 片 。 
IBM 的 工程 师 们 给 沃 森 看 了 100 部 铠 怖 电影 预告 片 ， 沃 森 对 这 些 预告 片 
进行 了 画面 、 声 音 、 创 作 构成 的 分 析 ， 并 标记 上 对 应 的 情感 。 它 甚至 
还 分 析 了 人 物 的 语调 和 背景 音乐 ， 以 便 判 断 声音 与 情感 的 对 应 关系 。 
在 沃 森 完 成 学 习 后 ， 工 作 人 员 又 将 完整 的 Morgan 电 影 导 入 ， 沃 森 迅 速 
挑 出 了 其 中 10 个 场景 组 成 了 一 段 长 达 6 分 钟 的 预告 片 。 在 沃 森 的 帮助 
下 ， 制 作 预 告 片 的 时 间 由 通常 的 10 天 到 1 个 月 ， 缩 减 到 了 短 短 的 24 个 小 
时 。 同 样 道理 ， 机 器 学 习 可 以 从 海量 的 生态 、 生 产 和 社会 环境 数据 中 
茜 取 出 大 量 的 未 曾 发 现 的 知识 。 

第 三 个 问题 最 有 意思 。 由 于 机 器 茜 取 出 的 知识 是 以 神经 网 络 参数 
集 形式 存在 的 ， 对 人 类 来 说 仍然 不 可 陈述 ， 也 很 难 在 人 类 间 传 播 。 但 
是 这 些 知识 却 非 常 容易 在 机 器 间 传 播 。 一 台 学 会 驾驶 的 汽车 可 以 瞬 
间 “ 教 会 ”其 他 100 万 台 汽 车 ， 只 要 把 自己 的 参数 集 复 制 到 其 他 机 器 即 
可 。 机 器 间 的 协同 行动 也 变 得 非常 容易 ， 无 非 是 用 一 组 反馈 信号 不 断 
地 调整 参加 协同 的 每 台 机 器 的 参数 。 

如 果 用 一 句 话 总 结 默 知识 和 明知 识 的 差别 那 就 是 波兰 尼 说 的 : We 
know more than we can tell (知道 的 远 比 能 说 出 来 的 多 ) 。 明 知识 就 像 
冰山 浮 出 水 面 的 一 角 ， 默 知识 就 是 水 下 巨大 的 冰山 。 这 两 类 知识 也 包 
括 那 些 尚 未 发 现 的 知识 ， 一 旦 发 现 ， 人 类 要 么 可 以 感受 ， 例 如 第 一 个 
登 上 珠 峰 的 人 能 感受 到 缺 氧 ， 要 么 从 理性 上 可 以 理解 ， 例 如 看 懂 一 个 
新 的 数学 定理 的 推导 过 程 。 


既 不 可 感受 也 不 能 表达 的 “上 暗 知识 ” 


既然 可 以 感受 的 是 默 知识 ， 可 以 表达 的 是 明知 识 ， 那 么 机 右 刚 刚 
发 现 的 ， 既 无 法 感受 也 无 法 表达 的 知识 天 是 暗 知识 。 我 们 用 是 否 能 感 
受 作 为 一 个 坐标 轴 ， 用 是 否 能 表达 〈 或 描述 ) 作为 另 一 个 坐标 轴 ， 就 
可 以 用 图 1.3 把 三 类 知识 的 定义 清晰 地 表达 出 来 。 在 这 张 图 里 ， 明 知识 
又 被 分 为 两 类 :第 一 类 是 那些 既 可 以 感受 又 可 以 表达 的 ， 例 如 浮力 定 
律 、 作 用 力 反 作用 力 定律 等 。 第 二 类 是 不 可 感受 可 以 表达 的 ， 如 大 部 
分 的 数学 以 及 完全 从 数学 中 推导 出 来 但 最 后 被 实验 验证 了 的 物理 定 
律 ， 以 及 相对 论 和 量子 力学 。 


Xi 


默 知 识 
例如 : 骑 车 
绘画 


明知 识 
例如 : 浮力 定律 
牛顿 定律 


不 可 感受 


图 1.3 知 识 的 分 类 


为 了 理解 暗 知识 的 本 质 ， 我 们 必须 移 搞 清楚 “知识 ”与 我 们 今天 各 
用 的 “信息 ?和 “数据 ?有 什么 不 同 。 稍 加 研究 殉 能 发 现 关 于 信息 、 数 据 


和 知识 的 定义 有 很 多 并 且 非 常 混乱 。 笔 者 在 下 面 给 出 一 组 符合 信息 论 
和 脑 神 经 科学 研究 结果 的 简单 而 目 洽 的 定义 。 

信息 是 事物 可 观察 的 表征 ， 或 者 说 信息 是 事物 的 外 在 表现 ， 即 那 
些 可 观察 到 的 表现 。 在 我 们 没有 望远镜 时 ， 谈 论 肉 眼 以 外 星空 里 的 信 
姑 豪 无 意义 。 


数据 是 已 经 描述 出 来 的 部 分 信息 。 任 何 一 个 物体 的 信息 量 都 非常 
大 ， 有 要 想 精 确 地 完全 描述 一 块 石头 ， 网 要 把 这 块 石 尖 里 所 有 基本 粒子 
的 状态 以 及 它们 之 间 的 关系 都 描述 出 来 ， 还 要 把 这 块 石 头 与 周围 环境 
和 物体 的 关系 都 描述 出 来 。 而 关于 这 块 石 头 的 数据 通常 则 少 得 多 ， 例 
如 它 的 形状 、 重 量 、 颜 色 和 种 类 。 

知识 则 是 数据 在 时 空中 的 关系 。 知 识 可 以 是 数据 与 时 间 的 关系 ， 
数据 与 空间 的 关系 。 如 采 把 时 间 和 空间 看 作 数 据 的 一 部 分 属性 ， 那 么 
所 有 的 知识 就 都 是 数据 之 间 的 关系 。 这 些 关 系 表现 为 某 种 模式 (或 者 
说 模式 束 是 一 组 关系 ) 。 对 模式 的 识别 就 是 认 知 ， 识 别 出 来 的 模式 就 
古 知 识 ， 用 模式 去 预测 就 是 知识 的 应 用 。 开 普 勒 的 行星 运动 定律 整 是 
那些 观测 到 的 数据 中 呈现 的 时 空 天 系 。 牛 顿 定律 的 最 大 页 献 可 能 不 在 
于 解释 现 有 行星 的 运动 ， 而 在 于 发 现 了 海王 星 。 这些 数 据 在 时 空中 的 
关系 只 有 在 极 少 数 的 情况 下 才 可 以 用 人 稍 洁 美妙 的 数学 方程 式 表达 出 
来 。 在 绝 大 多 数 情形 下 ， 知 识 表现 为 数据 间 的 相关 性 的 集合 。 这 些 相 
天 性 中 只 有 极 少数 可 以 被 感 常 、 倍 理解 ， 绝 大 多 数 都 在 我 们 的 感觉 和 
理解 能 力 之 外 。 

人 类 的 理解 能 力 由 感受 能 力 和 表达 能 力 组 成 。 人 类 的 感受 能 力 有 
限 ， 局 限 性 来 自 两 个 方面 。 一 是 只 能 感受 部 分 外 界 信 息 ， 例 如 人 了 服 无 
法 看 到 除 可 见 光 之 外 的 大 部 分 电磁 波 频 谱 ， 更 无 法 感受 大 量 的 物理 、 
化 学 、 生 物 和 环境 信息 。 二 和 是 人 类 的 感官 经 验 只 局 限 在 三 维 的 物理 至 
间 和 一 维 空 间 。 对 高 维 的 时 空 人 类 只 能 “ 降 维 ”想象 ， 用 二 维 空 间 类 
比 。 对 于 数据 间 的 关系 ， 人 类 质感 觉 只 能 把 握 一 阶 的 或 线性 的 关系 ， 
因为 地 球 的 自转 是 线性 的 ， 所 以 “时 间 ” 是 线性 的 。 例 如 当 我 们 看 到 水 


管 的 水 流 进 水 桶 里 时 ， 水 面 的 上 升 和 时 间 的 关系 是 线性 的 ， 我 们 和 任 感 
觉 可 以 预测 大 概 多 长 时 间 水 桶 会 满 。 人 类 感官 对 于 二 阶 以 上 的 非 线 性 
关系 就 很 难 把 握 。 例 如 当 水 桶 的 直径 增加 1 倍 时 ， 水 桶 能 盛 的 水 会 增加 
4 倍 ， 这 点 就 和 “直觉 ”不 相符 。 

人 类 的 表达 能 力 只 限于 那些 清晰 而 简单 的 关系 ， 例 如 少数 几 个 变 
量 之 间 的 关系 ， 或 者 是 在 数学 上 可 以 解析 表达 的 关系 (“解析 表达 ”的 
意思 就 是 变量 之 间 的 关系 可 以 用 一 组 方程 式 表 达 出 来 ) 。 当 数据 中 的 
变量 增 大 时 ， 或 当 数 据 间 的 关系 是 高 阶 非 线 性 时 ， 绝 大 多 数 情况 下 这 
些 关 系 无 法 用 一 组 方程 式 描述 。 所 以 当 数 据 无 法 被 感受 ， 它 们 之 间 的 
关系 又 无 法 用 方程 解析 表达 时 ， 这 些 数 据 间 的 关系 就 掉 入 了 人 类 感官 
和 数学 理解 能 力 之 外 的 上 暗 知识 大 海 。 

我 们 现在 可 以 回答 “一 个 人 类 无 法 理解 的 暗 知 识 的 表现 形式 是 什么 
样 的 ”， 瞳 知识 在 今天 的 主要 表现 形式 类 似 AljphaGo Zero 里 面 的 “神经 
网 络 ” 的 全 部 参数 。 在 第 三 章 详细 介绍 神经 网 络 之 前 ， 我 们 暂时 把 这 个 
神经 网 络 看 成 一 个 有 许多 旋钮 的 墨盒 子 。 这 个 黑 盒 子 可 以 接收 信息 ， 
可 以 输出 结果 。 黑 盒子 可 以 表达 为 一 个 一 般 的 数学 函数 : Y=f,(X)。 这 
里 Y 是 输出 结果 ，f,(X) 是 黑 盒 子 本 刁 ，X 是 输入 信息 ，w 是 参数 集 ， 就 
是 那些 旋钮 ， 也 就 是 暗 知 识 。 

我 们 如 何 知道 这 个 函数 代表 了 知识 ， 也 即 这 个 函数 有 用 ? 这 里 的 
判别 方法 和 现代 科学 实验 的 标准 一 样 : 实验 结果 可 重复 。 对 AlphaGo 
Zero 来 说 驶 是 每 次 都 能 赢 ; 用 严格 的 科学 语言 来 说 就 是 当 每 次 实验 条 
件 相 同时 ， 实 验 结果 永远 可 重复 。 读 完 第 三 章 ， 读 者 就 会 从 细节 上 清 
楚 瞳 知识 是 如 何 被 验证 的 。 

注意 ， 上 暗 知 识 不 是 那些 人 类 尚未 发 现 但 一 经 发 现 就 可 以 理解 的 知 
识 。 比 如 牛顿 虽然 没有 发 现 相 对 论 ， 但 如 果 爱 因 斯 坦 穿越 时 空 回 去 给 
他 讲 ， 他 是 完全 可 以 理解 的 。 因 为 理解 相对 论 用 到 的 数学 知识 如 微 积 
分 牛顿 都 有 了 。 即 使 在 微 积分 产生 之 前 ， 如 果 爱 因 斯 坦 穿越 2 000 年 给 


亚 里 士 多 德 讲 相对 论 ， 亚 里 士 多 德 也 能 理解 ， 至 少 能 理解 狭义 相对 论 
背后 的 物理 直觉 。 但 如 果 给 亚 里 士 多 德 讲 量 子 力学 他 就 不 能 理解 ， 因 
为 他 的 生活 经 验 中 既 没 有 薛 定 请 的 猫 (用 来 比喻 量子 力学 中 的 不 确定 
性 ， 一 个 封闭 的 盒子 里 的 猫 在 盒子 没 打 开 时 同时 既是 死 的 也 是 活 的 ， 
一 旦 打开 盒子 看 ， 猪 就 只 能 有 一 种 状态 ， 要 么 是 死 要 么 是 活 ) ， 他 的 
数学 水 平 也 无 法 理解 波动 方程 。 那 么 我 们 可 以 说 对 亚 里 士 多 德 来 说 ， 
量子 力学 殉 是 上 暗 知识 。 量 子 力 学 因为 没有 经 验 基 础 ， 甚 至 和 经 竹 予 
盾 ， 在 刚 发 现 的 初期 ， 几 乎 所 有 的 物理 学 家 都 大 呼 “ 不 懂 ”"， 至 今 能 够 
透彻 理解 的 人 也 极 少 。 甚 至 连 爱 因 斯 坦 都 不 接受 不 确定 性 原理 。 


人 类 过 去 积累 的 明知 识 皇 现 出 完美 的 结构 ， 整 个 数学 台 建 立 在 几 
个 公理 之 上 ， 整 个 物理 束 建 立 在 几 个 定律 之 上 ， 化 学 可 以 看 成 是 物理 
的 应 用 ， 生 物 是 化 学 的 应 用 ， 认 知 科学 是 生物 学 的 应 用 ， 心 理学 、 社 
会 学 、 经 济 学 都 症 这 些 基础 科学 的 应 用 组 合 。 这 些 知识 模块 之 间 有 清 
晰 的 关系。 但 是 机 器 挖 据 出 来 的 瞳 知识 则 像 一 大 袋 土 豆 ， 每 个 之 间 都 
没有 什么 关系 ， 更 准确 地 说 是 我 们 不 知道 它们 之 间 有 什么 关系 。 

我 们 可 以 预见 一 幅 未 来 世界 的 知识 图 谐 : 所 有 的 知识 分 为 两 大 类 
界限 分 明 的 知识 一 人 类 知识 和 机 需 知 识 。 人 类 的 知识 如 采 不 可 陈述 
则 不 可 记录 和 传播 。 但 机 器 发 据 出 来 的 知识 即使 无 法 陈述 和 理解 也 可 
以 记录 并 能 在 机 大 间 传播 。 这 些 瞳 知识 的 表现 方式 惑 是 一 堆 看 似 随机 
的 数 子 ， 如 一 个 神经 网 络 的 参数 集 。 这 些 暗 知识 的 传播 方式 束 古 通过 
网 络 以 光速 传 给 其 他 同类 的 机 器 。 

首 知 识 给 我 们 的 震撼 才刚 刚 开 始 。 从 2012 年 开始 的 短 短 几 年 之 
内 ， 机 顺 已 经 创造 了 下 面 这 些 “ 神 迹 ”: 对 复杂 病因 的 判断 ， 准 确 性 超 
过 医生 ， 可 以 惟妙惟肖 地 模仿 大 师 作 画 、 作 曲 ， 甚 至 进行 全 新 的 创 
作 ， 让 人 类 真 假 难 辨 ， 机 豆 飞 行 员 和 人 类 飞行 员 模 拟 衬 战 ， 百 战 百 
胜 。 

我 们 在 第 六 章 会 看 到 更 多 这 样 的 例子 。 人 类 将 进入 一 个 知识 大 航 
海 时 代 ， 我 们 将 每 天 发 现 新 的 大 陆 和 无 数 金 银 财宝 。 我 们 今天 面 对 的 


许多 问题 都 像 围 棋 一 样 有 巨大 的 变量 ， 解 决 这 些 问题 和 围棋 一 样 是 在 
组 合 爆 炸 中 寻求 最 优 方案 ， 例 如 全 球 变 暖 的 预测 和 预防 、 瘤 症 的 治 
愈 、 重 要 经 济 社会 政策 的 实施 效果 `“ 沙 漠 风 暴 ” 这 样 的 大 型 军事 行 
动 。 系 统 越 复杂 ， 变 量 越 多 ， 人 类 越 无 法 把 握 ， 机 需 学 习 束 越 得 心 应 
手 。 无 数 的 机 器 将 不 知 疲 众 地 角 夜 工作 ， 很 快 我 们 束 会 发 现 机 右 新 发 
掘 出 来 的 暗 知识 会 迅速 积 素 。 和 下 围棋 一 样 ， 瞳 知识 的 数量 和 质量 都 
将 快速 超过 我 们 在 某 个 领域 积 素 了 几 百 年 甚至 几 千 年 的 知识 。 明 知识 
忠 像 今天 的 大 陆 ， 上 暗 知识 束 像 大 海 ， 海 平面 会 迅速 升 高 ， 明 知识 很 快 
忠 会 被 海水 包围 成 一 个 个 孤岛 ， 最 后 连珠 称 表 玛 峰 也 将 被 淹没 在 海水 
这 

这 场 人 类 认 知 章 命 的 意义 也 许 会 超过 印刷 术 的 发 明 ， 也 许 会 超过 
文字 的 发 明 ， 甚 至 只 有 人 类 产生 语言 可 与 之 相 比 。 请 系 好 安全 带 ， 欢 
迎 来 到 一 个 你 越 来 越 不 慌 的 世界 ! 


1. ”我 在 斯 坦 福 大 学 的 博士 生 导 师 是 1959 年 麻 省 理工 学 院 的 博士 ， 从 我 的 导师 上 漳 到 第 
6 代 是 大 数学 家 高 斯 ， 到 第 11 代 就 是 莱 布 尼 次 ， 这 么 算 ， 我 算 莱 老 的 第 12 代 “学 孙 ”。 


一 
jy 
二 


在 深入 探讨 机 器 如 何 学 习 瞳 知识 之 前 ， 我 们 先 要 知道 机 器 也 
能 够 目 己 学 习 明 知识 和 上 默 知 识 。 在 这 一 章 我 们 介绍 机 器 学 习 的 五 
大 流派 的 故 层 逻辑 和 各 目 不 同 的 先 验 模型 。 虽 然 现在 神经 网 络 如 
日 中 天 ， 但 其 他 四 大 流派 也 不 容 忽视 。 


上 一 章 我 们 说 了 人 类 通过 感官 和 逻辑 能 掌握 明知 识 和 办 知 识 ， 但 
人 类 对 瞳 知识 既 无 法 感受 也 无 法 理解 。 现 在 我 们 要 看 看 机 恬 能 掌握 哪 
些 知识 ， 并 擅长 掌握 哪些 知识 。 


机 研学 习 明 知识 


计算 机 科学 家 最 早 的 想法 钙 把 目 己 的 明知 识 ， 包 括 能 够 表达 出 来 
的 彰 识 和 经 验 放 到 一 个 巨大 的 数据 库 里 ， 再 把 常用 的 判断 规则 写成 计 
算 机 程序 。 这 驶 是 在 20 世 纪 70 年 代 兴 起 并 在 20 世 纪 80 年 代 达 到 高 潮 
的 “知识 工程 ?和 “专家 系统 ”。 比 如 一 个 目 动 雪 驶 的 “专家 系统 ”融会 告 
诉 汽 车 , “如 果 红 灯亮 ， 就 停车 ， 如 果 转 区 时 过 到 直行 ， 束 避让 ”， 依 


塞 事先 编 好 的 一 条 条 程序 完成 自动 驾驶 。 结 果 你 可 能 想到 了 ， 人 们 无 
法 穷尽 所 有 的 路 况 和 场景 ， 这 种 “专家 系统 * 遇 到 复杂 情况 时 根本 不 会 
处 理 ， 因 为 人 没 教 过 。" 专 家 系统 ”过 到 的 另 一 个 问题 是 假设 了 人 类 所 
有 的 知识 都 是 明知 识 ， 完 全 没有 意识 到 默 知识 的 存在 。 一 个 典型 的 例 
子 是 20 世 纪 80 年 代 中 国 的 “中 医 专家 系统 ”。 当 时 计算 机 专家 找到 一 些 
知名 的 老 中 医 ， 通 过 访谈 记录 下 他 们 的 “ 望 闻 问 切 ”方法 和 诊断 经 验 ， 
然后 编 成 程序 输入 到 计算 机 中 。 在 中 医 眼中 每 一 个 病人 都 是 独特 的 。 
当 他 看 到 一 个 病人 时 会 根据 经 验 做 出 一 个 整体 的 综合 判断 。 这 些 经 验 
连 老 中 医 自己 都 说 不 清道 不 明 ， 是 典型 的 默 知识 。 所 以 中 医 诊断 绝 不 
是 把 舌苔 的 颜色 划分 成 几 种 ， 把 脉 象 分 成 几 十 种 ， 然 后 用 查 表 方式 就 
可 以 做 判断 的 。“ 专 家 系统 " 既 不 能 给 机 器 输入 足够 的 明知 识 ， 更 无 法 
把 默 知识 准确 地 表达 出 来 输入 给 机 器 。 所 以 ，“ 专 家 系统 "和 “知识 工 
程 "在 20 世 纪 80 年 代 之 后 都 仿 旗 息 鼓 了 。 

要 想 把 一 个 领域 内 的 所 有 经 验 和 规则 全 部 写 出 来 不 仅 耗费 时 间 ， 
而 且 需 要 集合 许多 人 。 即 使 如 此 ， 那 些 谁 也 没有 经 历 过 的 情况 还 是 天 
法 覆盖 。 电 脑 的 信息 处 理 速度 比 人 脑 快 得 多 ， 那 么 能 不 能 把 大 量 的 各 
种 场景 下 产生 的 数据 提供 给 机 器 ， 让 机 器 自己 去 学 习 呢 ? 这 就 是 现在 
风行 一 时 的 “机 器 学 习 ”。 


今天 的 机 器 可 以 目 己 学 习 两 大 类 明知 识 : 用 逻辑 表达 的 判断 规则 
和 用 概率 表达 的 事物 间 的 相关 性 。 


从 号 学 派 一 一 机 絮 目 己 措 索 出 决 倘 逻辑 


前 面 说 过 ， 理 性 主义 认为 事物 间 都 有 因果 关系 ， 基 于 因果 关系 ， 
通过 逻辑 论证 推理 束 能 得 到 新 知识 。 在 机 器 学 习 中 这 一 派 被 称 为 符号 
学 派 ， 因 为 他 们 认为 从 逻辑 关系 中 寻找 的 新 知识 都 可 以 归结 为 对 符号 
的 演算 和 操作 ， 就 像 儿 何 定理 的 推理 一 样 。 这 种 知识 通常 可 以 用 一 个 
逻辑 决策 树 来 表示 。 决 策 树 古 一 个 根据 事物 属性 对 事物 分 类 的 树 形 结 


构 。 比 如 冬天 医院 门诊 人 满 为 患 ， 测 完 体 温 ， 主 任 医生 先 问 “哪里 不 舒 
服 ”， 病 人 说 “头疼 ， 咳 嗽 ”， 主 任 医 生 再 听 呼 吸 。 感冒 、 流 感 、 肺 炎 都 
可 能 是 这 些 症状 的 原因 ， 现 在 要 根据 这 些 症状 判断 病人 到 发 得 了 什么 
病 ， 这 种 从 结果 反 着 找到 因 末 链条 的 过 程 整 叫 “ 逆 辣 演绎 ”。 这 时 候 主 
任 医 生 用 的 整 是 一 个 决策 树 . 体温 低 于 38.5%C ， 咳 嗽 ， 头 痛 ， 可 能 是 
普通 感冒 ， 回 去 多 喝 日 开水 ! 体温 高 于 38.5%C ， 还 剧烈 咳嗽 呼吸 困 
难 ， 可 能 是 肺炎 ， 咳 嗽 不 厉害 束 可 能 十 流感 。 实 际 情形 当然 要 比 这 复 
杂 “。 但 原理 就 是 根据 观察 的 证 状 逐 项 排除 ， 通 过 分 类 找到 病因 。 

这 时 候 门 诊 新 来 了 实习 医生 小 丽 ， 要 在 最 短 时 间 内 学 会 主任 医生 
的 诊断 方法 。 主 任 医生 忙 得 根本 没 时 间 教 她 ， 就 扔 给 她 一 省 过 去 病人 
的 病历 和 诊断 结果 ， 目 己 琢 麻 去 ! 小 丽 看 着 儿 十 个 病人 的 各 项 指标 和 
诊断 结果 ， 不 知道 从 哪里 下 手 。 这 时 候 刚 学 了 决策 树 的 主治 医生 小 张 
路 过 说 : 我 来 帮 你 。 唱 先 随便 猜 一 个 主任 的 判断 逻辑 ， 比 如 先 看 是否 
咳嗽 ， 再 看 是 否 发 烧 。 把 这 些 病 例 用 这 个 逻辑 推演 一 过 ， 如 果 人 逻辑 的 
判断 结果 和 主任 的 诊断 结果 吻合 ， 咀 束 算 猜 中 了 。 如 采 不 吻合 ， 明 整 
换个 逻辑 ， 无 非 是 换 些 判 断 准则 ， 比 如 你 可 能 一 开始 把 体温 标准 定 在 
了 37.5%C ， 结 采 把 很 多 普通 感 骨 给 判断 成 流感 了 。 当 你 用 39"C 时 ， 又 
会 把 流感 判断 成 普通 感冒 。 几 次 试验 你 就 找到 了 38.5C 这 个 最 好 的 
值 。 最 后 你 找到 的 逻辑 对 所 有 病例 的 判断 都 和 主任 医生 的 诊断 完全 吻 
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所 以 决策 树 学 习 就 是 完 找 到 一 个 决策 树 ， 它 对 已 知 数 据 的 分 类 和 
已 知 结果 最 接近 。 好 的 分 类 模型 是 每 一 步 都 能 让 下 一 步 的 “混杂 度 ” 最 
小 。 在 实际 的 机 吉 学 习 中 ， 决 策 树 不 是 猜 出 来 而 是 算出 来 的 。 通 过 计 
算 和 比较 每 种 分 类 的 袖 杂 度 的 降低 程度 ， 找 到 每 一 步 都 最 大 限度 降低 
间 杂 扫 的 过 程 ， 就 是 这 个 决策 树 机 器 学 习 的 过 程 。 所 以 机 器 学 习 决 策 
树 的 原理 是 : 根据 已 知 结果 可 以 反 推 出 事物 间 的 逻辑 关系 ， 再 用 这 些 
逻辑 关系 预测 新 的 结果 。 


在 这 个 例子 里 的 “知识 ”就 是 医生 的 诊断 方法 ， 作 为 明知 识 被 清 晰 
表达 为 决策 逻辑 树 。 而 这 种 计算 和 比较 分 类 混杂 大 的 方法 就 是 让 机 器 
目 动 学 习 医 生 诊 断 知 识 的 方法 。 


贝 时 斯 学派 一 一 机 絮 从 结果 推出 原因 的 概率 


符号 学 派 认 为 有 因 必 有 采 ， 有 采 必 有 因 。 贝 叶 斯 学 铂 问 ， 因 发 生 
条 一 定 发 生 吗 ?感冒 是 发 后 的 原因 之 一 ， 但 感冒 不 一 定 都 发 烧 。 贝 叶 
斯 学 小 承认 因 采 ， 但 认为 因 采 之 间 的 联系 是 不 确定 的 ， 只 是 一 个 概 
率 。 


我 们 的 经 验 中 比较 熟悉 的 是 当 一 个 原因 发 生 时 结果 出 现 的 概率 ， 
例如 你 感冒 后 会 发 烧 的 概率 ， 但 我 们 的 直觉 不 太 会 把 握 逆 概率 ， 即 知 
道 结果 要 求 推 出 原因 的 概率 ， 也 就 是 要 判断 发 烧 是 感冒 引起 的 概率 。 
贝 叶 斯 定理 就 是 教 我 们 怎么 算 这 样 的 概率 。 举 个 例子 ， 某 人 去 医院 检 
查 身 体 时 发 现 艾滋 病 病 毒 呈 阳 性 ， 现 在 告诉 你 一 个 艾滋 病人 检查 结 
呈 阳 性 的 概率 是 99%， 也 就 是 只 要 你 是 艾滋 病人 ， 检 查 结果 基本 都 是 
阳性 。 还 告诉 你 ， 人 和 群 中 艾滋 病 患者 大 约 是 0.3%， 但 所 有 人 中 查 出 阳 
性 的 人 有 2%。 现 在 问 得 艾滋 病 的 概率 多 大 ? 你 的 直觉 反应 可 能 是 ， 要 
出 大 事 了 ! 现在 我 们 看 看 贝 叶 斯 定理 怎么 说 。 贝 叶 斯 定理 如 下 : 

P (得 艾滋 病 | 检查 呈 阳 性 ) =P (得 艾滋 病 ) xP (检查 呈 阳 性 | 得 艾 
滋 病 ) /P (检查 呈 阳 性 ) =99%x0.3%/2%=14.85% 。 

也 就 是 说 即使 他 检查 呈 阳 性 ， 他 得 病 的 概率 也 不 到 15%1! 这 个 结 
果 非 常 违反 直觉 。 原 因 在 哪里 昵 ? 在 于 人 和 群 中 查 呈 阳性 的 概率 远大 于 
人 群 中 得 艾滋 病 的 概率 。 这 主要 是 由 于 检测 手段 不 准确 ， 会 “ 宛 枉 ”很 
多 好 人 。 所 以 以 后 不 管 谁 查 出 了 什么 病 呈 阳性 ， 你 要 问 的 第 一 件 事 是 
分 查 呈 阳性 和 得 病 的 比率 有 多 大 ， 这 个 比率 越 大 就 可 以 越 淡 定 。 所 以 
贝 叶 斯 定理 告诉 我 们 的 基本 道理 是 : 一 个 结果 可 能 由 很 多 原因 造成 ， 


要 知道 一 个 结果 是 由 哪个 原因 造成 的 ， 一 定 要 先知 道 这 个 原因 在 所 有 
原因 中 的 占 比 。 

一 个 好 的 医生 知道 ， 要 判断 病人 是 否 感冒 ， 只 看 是 否 发 烧 这 一 个 
症状 不 够 ， 还 要 看 是 否 有 咳嗽 、 嗓 子 痛 、 流 鼻涕 、 头 痛 等 症状 。 也 就 
是 我 们 要 知道 P 〈 感 冒 | 发 烧 、 咳 嗽 、 嗓 子 痛 、 流 鼻涕 、 头 痛 .……) 。 
贝 叶 斯 定理 告诉 我 们 计算 上 面 的 概率 可 以 通过 计算 P (发 烧 、 咳 嗽 、 嗓 
子 痛 、 头 痛 .…….| 感 冒 ) 获得 。 为 了 简化 计算 ， 我 们 这 里 假设 发 烧 、 咳 
嗽 、 嗓 子 痛 、 头 痛 这 些 症状 都 是 独立 的 ， 互 相 不 是 原因 (很 显然 这 个 
假设 不 完全 对 ， 很 可 能 嗓子 疼 是 咳嗽 引起 的 ) ， 这 样 P 〈 发 烧 、 咳 嗽 、 
嗓子 痛 、 头 痛 ..….| 感 冒 ) =P 《发 烧 | 感 冒 ) xP (咳嗽 | 感冒 ) xP (嗓子 
痛 | 感冒 ) xP 《头痛 | 感冒 ) x..………. 

这 里 每 一 个 概率 都 比较 容易 得 到 。 这 在 机 器 学 习 里 叫 作 “朴素 贝 叶 
斯 分 类 器 ”。 这 个 分 类 器 广泛 应 用 于 垃圾 邮件 的 过 滤 。 我 们 知道 垃圾 邮 
件 往往 会 有 “免费 、 中 奖 、 伟 可 、 发 财 * 这 类 词汇 ， 这 类 词汇 就 相当 于 
感冒 会 出 现 的 症状 ， 垃 圾 邮件 就 相当 于 感冒 。 过 滤 垃 圾 邮件 变 成 了 判 
断 在 出 现 这 些 词汇 的 情况 下 这 封 邮 件 是 垃圾 邮件 的 概率 ， 也 就 是 通过 
统计 P (出 现 “ 免 费 站 垃圾 邮件 ) ，P (出 现 “ 中 奖 站 垃圾 邮件 ) 等 的 概 
率 ， 来 算出 P (垃圾 邮件 | 出 现 “ 免 费 、 中 奖 、 伟 如、 发 财 ”......) 的 概 
素 。 


同样 的 原理 还 被 广泛 应 用 在 语音 识别 上 。 一 个 单词 有 各 种 各 样 的 
发 音 ， 语 音 识 别 欧 是 听 到 一 个 发 音 判断 是 茶 个 单词 的 概率 。 如 果 我 们 
把 “吃饭 ”这 个 词 的 天 南 地 北 男女 老少 的 发 音 都 收集 起 来 ， 统 计 出 * 吃 
饭 ” 这 个 词 和 各 种 发 音 的 频次 ， 我 们 听 到 一 个 发 音 “ 洽 砚 ? 时 ， 束 可 以 判 
断 是 否 在 说 “吃饭 ”。 为 什么 说 贝 叶 斯 村 到 分 类 名 是 机 絮 学 习 呢 ?因为 
它 古 通过 采集 大 量 数据 统计 出 每 个 单词 和 它们 分 别 对 应 的 发 音 的 频率 
来 判断 一 个 发 音 古 什么 单词 的 。 这 些 数 据 越 多 ， 判 断 的 准确 性 就 越 
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在 这 个 例子 里 , “知识 ”是 知 道 当 一 个 结果 发 生 时 征 哪个 原因 造成 
的 。 这 个 知识 被 清晰 地 表达 为 一 个 条 件 概 率 。 机 融通 过 统计 每 种 原因 
的 占 比 来 算出 从 结果 到 原因 的 概率 。 


类 推 学 泊 一 机 希 学 习 默 知识 


我 们 生活 中 很 多 经 验 来 目 类 比 。 医 生 一 看 病人 的 面部 表情 和 走路 
姿势 束 基 本 能 判断 出 是 普通 感冒 还 是 流感 ， 因 为 流感 证 状 比 感冒 厉害 
得 多 。 科 学 上 的 许多 重要 发 现 也 是 通过 类 比 。 当 达尔 文 读 到 马尔 院 斯 

(Malthus ，1766 一 1834) 的 《人 口 论 》 (Principle of Population) 
时 ， 被 人 类 社会 和 上 自然界 的 激烈 竞争 的 相似 性 所 触动 玻 尔 的 电子 轨 
道 模型 直接 借鉴 了 太阳 系 的 模型 。 机 如 学 习 中 用 类 比方 法 的 这 一 派 叫 
类 推 学 派 ， 他 们 的 逻辑 很 简单 :第 一 ， 两 个 东西 的 某 些 属性 相同 ， 它 
俩 就 是 类 似 的 ， 第 二 ， 如 果 它 们 的 已 知 属性 相同 ， 那 么 它们 的 未 知 属 
性 也 会 相同 。 开 好 车 上 班 的 人 可 能 也 会 用 苹果 手机 ， 喜 欢 看 《星球 大 
战 》 (Star Wars) 的 人 可 能 也 会 喜欢 看 《三 体 》 等 。 类 比 的 逻辑 可 以 
明确 表达 ， 但 具体 的 类 比 常 党 是 默 知识 。 例 如 老 警 察 一 眼 残 能 看 出 谁 
是 小 偷 ， 但 不 一 定 说 得 清楚 原因 。 

在 类 推 学 派 中 最 基础 的 算法 叫 最 近邻 法 。 最 近邻 法 的 第 一 次 应 用 
是 1894 年 伦敦 又 发 霍乱 ， 在 伦敦 的 某 些 城区 每 8 个 人 残 会 死 1 个 ， 当 时 
的 理论 是 这 种 疾病 是 由 一 种 “不 民 气 体 ” 造 成 的 。 但 这 个 理论 对 控制 疾 
病 没有 用 。 内 科 医 生 约 翰 : 斯 庄 把 伦 致 每 个 霍乱 病例 都 标 在 地 图 上 ， 他 
发 现 所 有 的 病例 都 靠近 一 个 公共 水 泵 。 最 后 推断 病因 是 这 个 水 泵 的 水 
源 污染 ， 当 他 说 服 大 家 不 要 再 用 这 个 水 泵 的 水 后 ， 疾 病 束 得 到 了 控 
制 。 在 这 里 这 些 数据 的 相似 点 就 是 和 这 个 水 泵 的 距离 。 最 近邻 法 还 有 
一 个 应 用 就 是 在 网 上 搜 照 片 ， 你 对 高 铁 上 堪 座 的 人 很 愤慨 ， 你 把 他 的 
照搬 上 传 ， 网 站 给 你 显示 出 几 张 和 他 长 得 最 像 的 照 上 请 ， 并 且 有 文字 ， 


你 一 看 ， 天 哪 ， 还 是 个 在 读 博 士 生 ! 同样 的 道理 ， 很 多 智能 手机 都 可 
以 目 动 进行 照片 分 类 ， 把 你 手机 里 的 人 像 都 目 动 归 类 。 


在 类 推 学 派 中 ， 第 一 件 事 是 要 定义 “相似 度 ”。 相 似 度 可 以 是 身 
高 、 收 入 等 连续 变量 ， 也 可 以 是 丈 了 某 一 类 书 的 次 数 的 统计 变量 ， 也 
可 以 是 性 别 这 样 的 离散 变量 。 总 之 ， 只 有 定义 了 相似 度 ， 才 能 度量 一 
个 分 类 方法 是 否 最 优 。 人 可 以 感受 相似 度 ， 但 无 论 是 人 的 感官 还 是 大 
脑 都 无 法 量化 相似 度 。 人 类 在 做 相似 度 比较 时 ， 甚 至 都 不 知道 目 己 在 
比较 哪些 特征 和 属性 ， 但 机 器 可 以 很 容易 量化 这 些 相似 度 。 所 以 只 
机 器 抓 准 了 特征 和 属性 ， 比 人 的 判断 还 准 。 

类 推算 法 可 以 用 于 跨 领 域 的 学 习 。 一 个 消费 品 公 司 的 高 管 到 互联 
网 嫁 体 公司 不 需要 从 头 学 起 ， 华 尔 街 雇 用 很 多 物理 学 家 来 全 究 交易 模 
型 ， 征 因为 这 些 不 同 领域 问题 的 内 在 数学 结构 是 类 似 的 。 类 推算 法 最 
重要 的 是 能 用 类 比 推 寻 出 新知 识 ， 台 像 我 们 前 面 提 到 的 达尔 文 受 《人 
口 论 》 的 局 发 。 


虽然 机 妖 可 以 学 习 明 知识 和 默 知识 ， 但 它 最 大 的 本 事 古 学 习 上 暗 知 


识 。 


机 恬 发 现 瞳 知识 


上 暗 知识 束 是 那些 既 无 法 补 人 类 感受 义 不 能 表达 出 来 的 知识 。 也 束 
苹 说 人 类 本 身 无 法 理解 和 掌握 这 些 知 识 ， 但 机 器 却 可 以 。 机 器 有 两 种 
方法 可 以 掌握 这 些 知识 : 模仿 人 脑 和 模仿 演化 。 


联结 和 学派 


联结 学 派 的 基本 思路 就 古 模 仿 人 脑 神经 元 的 工作 原理 : 人 类 对 所 
有 模式 的 识别 和 记忆 建立 在 神经 元 不 同 的 连接 组 合 方式 上 。 或 者 说 一 
个 模式 对 应 着 一 种 神经 元 的 连接 组 合 。 联 结 学 派 束 是 目前 最 火爆 的 神 
经 网 络 和 深度 学 习 ， 它 在 五 大 学 派 中 占 绝对 统治 地 位 。 目 前 人 工 知 能 
的 高 科技 公司 中 绝 大 部 分 是 以 神经 网 络 为 主 。 第 三 章 我 们 专门 讨论 神 
经 网 络 。 


进化 学 派 


机 器 学 习 中 一 共有 五 大 学 派 ， 最 后 一 个 学 派 钙 进化 学 派 。 他 们 厦 
激进 主义 经 验 派 ， 是 彻底 的 不 可 知 论 者 。 进 化 学 派 不 仅 觉得 因果 关系 
苹 先 验 模型 ， 甚 至 觉得 类 比 ， 神 经 元 连接 也 都 是 先入 为 主 的 模型 。 他 
们 认为 不 管 选择 什么 样 的 移 验 模型 ， 都 是 在 上 帝 面 前 要 人 类 的 小 聪 
了 明 ， 世 界 太 复杂 ， 没 法 找到 模型 。 进 化 学 派 的 基本 思路 是 模仿 目 然 界 
的 演化 : 随机 的 基因 变异 被 环境 选择 ， 适 者 生存 。 他 们 的 做 法 就 是 把 
-种 算法 表达 成 像 基 因 一 样 的 字符 串 ， 让 不 同 的 算法 基因 交配 ， 让 生 
出 来 的 儿女 算法 去 处 理 问题 ， 比 爸 妈 好 的 留 下 来 配种 继续 生 孙 子 ， 比 
和 爸 妈 差 的 就 淘汰 。 

比如 我 们 要 通过 进化 算法 找到 最 优 的 垃圾 邮件 过 滤 算 法 。 我 们 先 
假设 凡是 垃圾 邮件 都 包含 1 000 个 诸如 “人 免费 “中 奖 * 不 转 不 是 中 国 
人 ”这 样 的 单词 或 句子 。 对 于 每 个 单词 我 们 可 以 对 邮件 施加 一 些 规则 ， 
如 删除 或 者 怀疑 (“怀疑 ”是 进一步 看 有 没有 其 他 垃圾 词汇 ) 等 。 如 果 
规则 束 这 两 种 ， 我 们 可 以 用 一 个 比特 表示 : 1 删除 ，0 怀 疑 。 这 样 要 对 
付 有 1 000 个 垃圾 词 的 算法 就 可 以 表示 成 1000 比 特 的 一 个 子 符 串 。 这 个 
字符 串 束 相当 于 一 个 算法 的 基因 。 如 有 果 我 们 从 一 堆 随机 的 1 000 比 特长 
的 字符 串 开始 ， 测 量 每 个 字符 串 代 表 的 算法 的 适应 度 ， 也 即 它 们 过 渡 
垃圾 邮件 的 有 效 性 。 把 那些 表现 最 好 的 字符 串 留 下 来 互相 “交配 ”， 产 
生 第 二 代 字 符 串 ， 继 续 测试 ， 如 此 循环 ， 直 到 一 代 和 下 一 代 的 适应 度 


没有 进步 为 止 。 注 意 ， 这 里 和 生物 的 进化 有 个 本 质 区 别 ， 束 是 所 有 的 
算法 都 是 “长 生 不 老 ? 的 。 所 以 老 一 代 里 的 优秀 算法 不 仅 可 以 和 同 代 的 
算法 竞争 ， 而 且 可 以 和 儿子 、 朱 子 、 子 子孙 孙 互 相 竞 争 ， 最 后 的 胜利 
者 不 一 定 都 是 同一 代 的 算法 。 

进化 滤 法 的 问题 是 “进化 ”上 毫 无 方 同感 ， 完 全 是 瞎 蒙 。 在 前 面 的 垃 
圾 邮件 过 滤器 例子 里 ，1 000 比 特 的 字符 串 的 所 有 可 能 性 是 29， 也 即 
1039， 即 使 用 目前 世界 最 快 的 超级 计算 机 ,“ 进 化 ”到 地 球 爆 炸 都 不 可 
能 穷尽 所 有 可 能 ， 在 有 限时 间 内 能 探索 的 空间 只 是 所 有 可 能 空间 的 极 
少 一 部 分 。 地 球 可 是 用 了 40 亿 年 时 间 才 进化 出 了 现在 所 有 的 生物 。 

图 2.1 是 美国 华盛顿 大 学 佩 德 罗 . 多 明 戈 斯 (Pedro Domingos) 教授 
总 结 的 一 张 五 大 流派 “八卦 图 ”。 


机 器 学 习 中 的 符号 学 派 、 贝 叶 斯 学 派 、 类 推 学 派 和 联结 学 派 的 共 
同 点 是 根据 一 些 已 经 发 生 的 事件 或 结果 ， 建 立 一 个 预测 模型 ， 反 复 调 
整 参 数 使 该 模型 可 以 拟 合 已 有 数据 ， 然 后 用 此 模型 预测 狐 的 事件 。 不 
同 的 是 它们 各 目 育 后 的 先 验 世 界 模型 。 符 号 学 派 相 信 事 物 间 都 有 产 密 
的 因 采 关系 ， 可 以 用 逻辑 推导 出 来 ; 贝 叶 斯 学 派 认为 ， 因 发 生 ， 采 不 
一 定 发 生 ， 而 是 以 茶 个 概率 发 生 ;， 类推 学 派 认 为 ， 这 个 世界 也 许 根本 
没有 原因 ， 我 们 只 能 观测 到 结果 的 相似 ， 如 采 一 只 马 走 路 像 锡 于 ， 叫 
起 来 像 鸭子， 那么 它 束 是 只 鸭子 ， 联 结 学 派 认 为 ， 相 似 只 古 相 关 性 能 
被 人 理解 的 那 层 表 皮 ， 隐 藏 的 相关 性 深远 得 无 法 用 语言 和 逻辑 表达 ; 
最 后 进化 学 派 认为 ， 什 么 因果 ? 什么 相关 ? 我 的 世界 模型 就 古 没 有 模 
型 ! 从 零 开 始 ， 不 断 试 错 ， 问 题 总 能 解决 ! 


符号 学 派 
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图 2.1 机 器 学 习 的 五 大 流派 


图 片 来 源 ， 佩 德 罗 -多 明 戈 斯 ，《 终 极 算法 》， 中 信 出 版 社 ，2017 年 。 
现在 我 们 终于 可 以 清理 一 下 满天飞 的 名 词 了 。 我 们 在 媒体 上 最 第 
听 到 的 是 这 四 个 名 词 : 人 工 知 能、 机 器 学 习 、 神 经 网 络 、 深 度 学 习 。 


这 四 个 词 的 关系 如 图 2.2 所 示 ， 人 工 智能 是 最 大 的 一 个 圆 ， 圆 里 面 分 为 


两 部 分 : 一 部 分 叫 人 工学 习 ， 也 区 ® 是 前 面 我 们 讲 的 专家 系统 ， 男 一 部 
分 叫 机 器 学 习 ， 就 古 机 器 目 己 学 习 。 机 器 学 习 里 面包 含 神经 网 络 ， 在 
神经 网 络 里 面 还 要 再 分 ， 一 个 是 浅 度 学 习 ， 一 个 十 深度 学 习 。 在 过 去 
心 片 集成 度 低 时 ， 我 们 只 能 模仿 很 少 的 神经 元 。 现 在 由 于 集成 度 在 提 


高 ， 我 们 可 以 模仿 很 多 的 神经 元 ， 当 很 多 神经 元 被 组 成 多 层 的 网 络 
时 ， 我 们 束 叫 它 深度 学 习 。 所 以 人 工 状 能 、 机 器 学 习 、 神 经 网 络 和 深 


度 学 习 的 关系 ， 其 实 就 像 一 个 洋葱 一 样 ， 一 层 包 识 一 层 ， 最 外 面 的 是 
人 工 智能 ， 往 里 一 点 是 机 器 学 习 ， 再 往 里 是 神经 网 络 ， 最 深层 就 是 深 
度 学 习 。 

所 以 这 四 个 词 有 下 面 的 包含 关系 ， 人 工 智能 > 机 器 学 习 > 神 经 网 络 


> 深度 学 习 。 


机 售 学 习 


神经 网 络 


图 2.2 AI 中 四 个 概念 的 包含 关系 
今天 我 们 说 到 的 人 工 智能 ， 其 实 就 是 机 器 学 习 里 面 的 神经 网 络 和 


深度 学 习 。 但 是 在 一 般 的 商业 讨论 中 ， 这 四 个 概念 经 党 是 混 着 用 的 。 


生计 一 二 二 


一 


伸 经 网 络 一 一 萃取 隐 牙 相关 性 


在 了 解 了 机 器 学 习 各 个 流派 的 方法 后 ， 本 书 的 主角 “神经 网 
络 ? 现 在 内 亮 登 场 。 本 章 将 深入 介绍 神经 网 络 学 习 的 原理 和 在 商业 


上 应 用 最 多 的 几 种 形态 ， 以 及 它们 的 适用 范围 。 有 了 这 些 基础 ， 
我 们 才 可 以 真正 理解 AlphaGo Zero 是 怎样 发 现 神 迹 般 的 瞳 知 识 的 。 
对 于 只 想 了 解 AI 商 业 前 景 的 读者 ， 也 可 以 先 跳 过 这 一 章 ， 读 完 后 
面 描述 机 大 学 习 神 奇 应 用 的 章节 后 再 回来 弄 避 它 是 如 何 工作 的 。 


从 感知 硕 到 多 层 神经 网 络 


1943 年 ， 心 理学 家 沃 伦 : 麦 卡 洛克 (Warren McCulloch) 和 数理 膛 
辑 学 家 沃尔特 : 皮 敬 (Walter Pitts) 提出 并 给 出 了 人 工 神经 网 络 的 概念 
及 人 工 神经 元 的 数学 模型 ， 从 而 开 了 人 类 神经 网 络 人 研究 的 先河 。 世 界 
上 第 一 个 人 工 神 经 元 叫 作 TLU (Threshold Linear Unit， 即 阐 值 逻辑 单 
元 或 线性 赋值 单元 ) 。 最 初 的 模型 非常 简单 ， 只 有 几 个 输入 端 和 输出 
端 ， 对 权 值 的 设置 和 对 阔 值 的 调整 都 较为 简单 。 


1957 年 ， 一 个 开创 性 的 人 工 神 经 网 络 在 康 奈 尔 航空 实验 室 诞生 
了 ， 它 的 名 字 叫 作 感 知 器 (Perceptron) ， 由 弗兰克 : 罗 和 森 布 业 特 
(Frank Rosenblatt) 提出 ， 这 也 是 首次 用 电子 线路 来 模仿 神经 元 。 他 
的 想法 很 简单 ， 如 图 3.1 所 示 : 将 其 他 电子 神经 元 的 几 个 输入 按照 相应 
的 权重 加 在 一 起 ， 如 果 它 们 的 和 大 于 一 个 事先 给 定 的 值 ， 输 出 束 打 
开 ， 让 电流 通 癌 下 一 个 神经 元 ;如果 小 于 这 个 事先 给 定 的 值 ， 输 出 束 
天 闭 ， 没 有 电流 流 癌 下 一 个 神经 元 。 
1960 年 ， 斯 坦 福 大 学 教授 伯 纳 德 : 威 德 罗 (Bernard Widrow) 和 他 
的 第 一 个 博士 生 马 尔 西安 . 泰 德 . 霍 夫 (Marcian Ted Hoff) 提出 了 自 适 
应 线性 神经 元 (ADaptive LInear NEurons，ADLINE) 。 他 们 第 一 次 提 
出 了 一 种 可 以 自动 更 新 神经 元 系数 的 方法 (机 器 自我 学 习 的 原始 起 
点 ) : 用 输出 误差 的 最 小 均 方 去 自动 从 代 更 新 神经 元 权重 系数 ， 直 至 
输出 信号 和 目标 值 的 误差 达到 最 小 。 这 样 束 实现 了 权重 系数 可 以 自动 
连续 调节 的 神经 元 。 目 适应 线性 神经 元 最 重要 的 贡献 是 第 一 个 使 用 输 
出 信号 和 目标 值 的 误差 目 动 反 馈 来 调整 权 值 ， 这 也 为 后 面神经 网 络 发 
展 历 史上 里 程 碑 式 的 反 回 传播 算法 黄 定 了 基础 。 
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图 3.1 感 知 器 的 电子 线路 


这 个 单 层 的 神经 网 络 也 被 称 为 目 适 应 信号 处 理 右 ， 被 广泛 应 用 在 
通信 和 雷达 当中 。 霍 夫 后 来 加 入 更 特 尔 ， 在 1971 年 设计 了 世界 上 第 一 
个 微 处 理 器 Intel 4004。 威 德 罗 教授 也 走笔 者 20 世 纪 80 年 代 后 期 在 斯 坦 
福 大 学 的 博士 生 导 师 。 笔 者 曾经 在 他 的 指导 下 做 过 神经 网 络 的 研究 工 
作 。 图 3.2 是 笔者 2016 年 和 他 讨论 神经 网 络 未 来 发 展 时 的 合影 ， 笔 者 手 


中 拿 的 那个 墨盒 子 束 是 他 1960 年 做 出 的 ADLINE 单 层 神 经 网 络 。 这 个 
例子 到 今天 还 在 工作 ， 美 国 国家 博物 馆 曾 经 想 要 这 个 盒子 做 展品 ， 但 
威 德 罗 教授 回答 说 “我 还 要 用 它 来 教学 ”。 


威 德 罗 教 授 在 1962 年 还 提出 过 一 个 三 层 的 神经 网 络 (Multi-Layer 
Adaptive Linear Neurons，MADALINE) ， 但 没有 找到 一 个 能 够 用 于 任 
意 多 层 网 络 的 、 答 少 的 更 新 权重 系数 的 方法 。 由 于 单 层 网 络 有 广泛 应 


用 而 多 层 网 络 的 运算 速度 太 慢 (当时 的 电脑 运算 速度 是 今天 的 100 亿 分 
之 一 ) ， 所 以 在 MADALINE 之 后 没有 人 去 继续 深入 探讨 多 层 网 络 。 


由 于 缺少 对 人 脑 工 作 模 式 的 了 解 ， 神 经 网 络 的 进展 一 度 较为 组 
慢 ， 而 它 进 入 快速 发 展期 的 一 个 触发 点 则 是 医学 领域 的 一 个 发 现 。 
1981 年 ， 诺 贝尔 生理 学 或 医学 奖 颁 发 给 了 美国 神经 生物 学 家 大 卫 : 胡 贝 
尔 (David Hubel) 、 托 尔 斯 滕 : 威 塞 尔 (Torsten Wiesel) 和 罗 杰 : 斯 佩 


里 (Roger Sperry) 。 前 两 位 的 主要 贡献 是 发 现 了 人 类 视觉 系统 的 信息 
处 理 采 用 分 级 方式 ， 即 在 人 类 的 大 脑 皮 质 上 有 多 个 视觉 功能 区 域 ， 从 
低级 至 高 级 分 别 标 定 为 Vi~V5 等 区 域 ， 低 级 区 域 的 输出 作为 高 级 区 域 
的 输入 。 人 类 的 视觉 系统 从 视网膜 (Retina) 出 发 ， 经 过 低级 的 V1 区 
提取 边缘 特征 ， 到 V2 区 的 基本 形状 或 目标 的 局 部 ， 再 到 高 层 V4 的 整个 
目标 〈 例 如 判定 为 一 张 人 脸 ) ， 以 及 到 更 高 层 进行 分 类 判断 等 。 也 就 
征 说 高 层 的 特征 征 低 层 特征 的 组 合 ， 从 低层 到 高 层 的 特征 表达 越 来 越 
抽象 和 概念 化 。 至 此 ， 人 们 了 人 解 到 大 脑 古 一 个 多 层 深 度 架构 ， 其 认 知 
过 程 也 是 连续 的 。 

神经 网 络 学 习 的 本 质 是 大 量 神经 元 通过 复杂 的 连接 形成 记忆 。 
为 分 析 人 简单 且 容 易 用 电子 元 件 实现 ， 一 开始 人 工 神 经 网 络 束 如 图 3.3 那 
样 由 一 层 一 层 组 成 。 其 实 人 脑 的 神经 元 连接 非常 复杂 ， 没 有 这 人 么 一 层 
一 层 的 清晰 和 有 秩序 。 但 我 们 目前 并 没有 和 弄 清 楚 人 脑 神 经 元 的 连接 方 
式 ， 先 从 简单 的 假设 入 手 是 科学 的 一 般 方 法 。 


输入 层 隐 层 输出 层 


图 3.3 一 个 多 层 神 经 网 络 (其 中 每 个 方块 代表 一 个 神经 元 ) 


20 世 纪 80 年 代 ， 神 经 网 络 的 另 一 个 重大 突破 是 当时 在 加 利 福 尼 亚 
州 大 学 圣迭戈 校区 任教 的 美国 心理 学 家 大 卫 : 鲁 梅 哈 特 (David 


Rumelhart) 和 在 卡 内 基 梅 隆 大 学 任教 的 计算 科学 家 杰 弗 里 : 辛 顿 

(Jeffrey Hinton) 提出 的 多 层 神经 网 络 ， 以 及 一 个 普遍 的 自动 更 新 权 
重 系数 的 方法 。 前 面 说 过 ， 威 德 罗 教授 在 1962 年 提出 过 一 个 三 层 的 神 
经 网 络 ， 但 功 亏 一 筑 ， 没 有 找到 一 个 简洁 的 任意 多 层 网 络 权 重 系数 的 
更 新 方法 。 这 个 问题 在 1986 年 被 鲁 梅 哈 特 和 伴 顿 解决 了 。 他 们 借鉴 了 
单 层 神经 网 络 中 威 德 罗 - 霍 夫 (Widrow-Hoff) 反馈 算法 的 思路 ， 同 样 
用 输出 误差 的 均 方 值 一 层 一 层 递 进 地 反馈 到 各 层 神 经 网 络 去 更 新 系 
数 。 这 个 算法 就 是 今天 几乎 所 有 神经 网 络 都 在 用 的 “ 反 癌 传播 ” 算 
法 。 友 问 传播" 听 上 去 很 各 大 上 实际 上 束 是 在 自动 控制 和 系统 理 

论 里 面 多 年 一 直 在 用 的 “反馈 ?， 只 不 过 在 多 层 网 络 中 反馈 是 一 层 一 层 
递 进 的 。 因 为 一 个 多 层 的 神经 网 络 妆 通过 成 干 上 万 次 “用 输出 误差 反 合 
调整 系数 ”， 所 以 运算 量 非常 大 。 在 20 世 纪 80 年 代 的 计算 能 力 限制 下 ， 
神经 网 络 的 规模 非常 小 (例如 三 层 ， 每 层 几 十 个 神经 元 ) 。 这 种 小 规 
模 的 神经 网 络 虽 然 显 示 了 神奇 的 能 力 (例如 能 够 识别 0~9 一 共 10 个 手写 
体 数 字 ) ， 但 仍然 无 法 找到 真正 的 商用 。 


从 第 一 个 电子 神经 元 感知 器 的 发 明 (1957 年 ) 到 神经 网 络 的 大 规 
模 应 用 (2012 年 ) 整整 经 历 了 55 年 的 艰 圣 探索 ， 许 多 天 才 科 学 家 不 顾 
叶 讨 和 失败 ， 坚 信 这 条 路 是 对 的 。 图 3.4 古 在 这 个 探索 旅程 中 做 出 重大 
页 献 的 科学 家 。 


深度 神经 网 络 


有 训 
多 层 感知 器 向 量 支持 机 “ 《提前 训练 ) 
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性 神经 元 ”或 非 感知 器 ( 反 向 传播 ) 


感知 器 
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和 


鲁 梅 哈 特 - 屯 -威廉 姆 斯 BE - 克 特 茨 顿 - 拉 斯 兰 德 


图 3.4 1940 一 2010 年 基于 神经 网 络 的 AI 发 展 史 上 做 出 突破 性 贡献 的 科学 家 


图 片 来 源 : https:/beamandrew.github.io/deeplearning/2017/02/23/deep_learning_101_part1.html 。 


神经 网 络 模 型 : 满 是 旋钮 的 黑 盒 子 


在 这 一 节 中 ， 我 们 用 最 简单 的 方法 介绍 机 器 学 习 的 机 理 。 像 图 3.3 
这 样 一 个 多 层 神 经 网 络 的 左 端 是 输入 端 ， 即 要 识别 的 信息 从 这 里 输 
入 。 例 如 要 识别 一 幅 图 像 ， 每 个 输入 Xi 就 是 这 张 图 像 的 一 个 像素 的 灰 
度 值 (为 了 简单 起 见 我 们 假设 图 像 是 黑白 的 ， 如 末 是 彩色 的 ， 我 们 可 
以 想象 三 个 这 样 的 网 络 重合 起 来 用 ) 。 从 输入 层 的 每 个 神经 元 到 下 一 
层 的 每 个 神经 元 者 有 一 个 连接 ， 从 输入 层 的 第 i 个 神经 元 到 下 一 层 第 j 个 
神经 元 的 连接 有 一 个 乘法 因子 Wij。 每 一 层 到 下 一 层 都 类 似 。 在 输出 
端 ， 每 根 线 对 应 一 个 识别 出 来 的 物体 。 我 们 可 以 把 每 个 输出 想象 成 一 
个 灯泡 。 当 机 器 发 现 输入 是 某 个 物体 时 ， 对 应 该 物体 的 灯泡 就 在 所 有 
输出 灯泡 里 最 亮 。 

像 这 样 一 个 多 层次 的 神经 网 络 是 如 何 “ 学 习 ” 的 呢 ? 我 们 可 以 把 这 
个 多 层 网 络 看 成 一 个 黑 人 盒子。 盒子 外 面 有 许多 可 以 调节 的 旋钮 ， 如 图 
3.5 风 未 


有 许多 旋钮 的 黑 盒子 


车 =+1 


猫 =+2 
一 一 机 器 上 有 许多 可 调 旋钮 (神经 元 之 间 连 接 的 权 系数 ) 
一 一 对 应 每 类 输入 ， 输 出 有 一 个 灯泡 〈 即 给 每 类 数据 赋 一 个 输出 目标 值 ， 
如 车 =+1， 猫 =+2) 
一 一 把 一 类 数据 喂 给 机 器 ， 调 旋钮 直到 只 有 对 应 这 类 数据 的 灯泡 亮 (输出 
达到 目标 值 ) 
一 一 循环 喂 数据 、 调 旋钮 ， 直 到 对 所 有 类 型 的 输入 都 达到 输出 目标 值 
图 3.5 机 器 学 习 : 调节 黑 盒 子 外 的 旋钮 


我 们 的 第 一 个 任务 古训 练 这 个 黑金 子 能 够 识别 图 像 中 的 物体 。 例 
如 在 图 3.5 中 ， 输 入 端 有 两 张 图 ， 一 张 汽车 图 片 和 一 张 猫 的 图 片 。 我 们 
训练 的 目的 是 只 要 输入 各 种 汽车 的 图 片 ， 机 瞻 束 能 告诉 我 们 “这 张 图 是 
汽车 ”( 对 应 “汽车 ”这 个 物体 的 输出 端的 灯泡 最 亮 ) 。 同 样 ， 只 要 我 们 
输入 猫 的 图 片 ， 机 恬 就 告诉 我 们 “这 张 图 是 猫 ”( 对 应 “ 猫 * 的 灯泡 最 
亮 ) 。 训 练 的 过 程 是 这 样 的 ， 我 们 先 指定 输出 的 一 个 灯泡 最 亮 对 应 于 
识别 出 了 汽车 ， 第 二 个 灯泡 最 亮 对 应 猫 ， 等 等 。 我 们 先 找到 足够 多 的 
汽车 图 片 (例如 1 万 张 ， 训 练 图 片 越 多 ， 训 练 出 的 机 器 判断 越 准确 ) ， 
一 张 一 张 给 机 器 “看 ” (实际 训练 是 一 组 一 组 地 给 机 器 看 ) 。 在 机 器 没 
有 训练 好 时 ， 当 我 们 输入 一 张 汽车 独 乒 时 ， 输 出 的 灯泡 会 乱 亮 。 我 们 
此 时 耐心 地 调节 那些 旋钮 直到 只 有 对 应 “汽车 ”的 灯泡 亮 为 止 。 然 后 我 
们 输入 下 一 张 汽 车 图 片 ， 也 调 到 只 有 对 应 汽车 的 灯泡 腕 为 止 ， 如 此 一 
直到 1 万 张 。 然 后 我 们 再 输入 第 一 张狂 的 图 片 ， 调 节 旋 钮 直到 对 


应 “ 猫 ” 的 灯泡 亮 为 止 ， 也 如 此 一 直到 1 万 张 猫 的 图 片 都 输入 完 为 止 。 如 
果 我 们 让 机 器 学 习 1 000 种 物体 的 图 片 ， 那 我 们 对 每 种 物体 图 片 都 要 如 
此 操作 ， 让 输出 端 对 应 这 种 物体 的 灯泡 最 亮 。 所 以 在 机 大 学 习 中 ,“ 训 
练 ” 是 最 耗 时 的 。 在 训练 过 程 中 ， 这 些 训练 用 的 图 片 我 们 事先 知道 是 什 
么 内 容 ， 或 者 叫 作 “标注 ?过 的 图 片 。 当 训练 结束 后 ， 第 二 步 是 测试 。 
也 就 十 拿 一 些 不 在 训练 集 里 面 的 图 片 让 机 器 辨认 ， 如 采 机 如 者 能 辨认 
出 来 ， 这 部 机 妖 就 算 训 练 好 了 ， 可 以 交付 使 用 了 。 一 旦 训练 测试 结 
束 ， 机 器 的 参数 集束 不 改变 了 ， 也 区 ® 是 所 有 的 旋钮 都 固定 不 动 了 。 只 
要 是 输入 训练 过 的 种 类 ， 机 器 都 应 该 能 识别 出 来 。 


如 果 一 部 机 器 要 识别 1000 种 物体 的 图 片 ， 束 要 至 少 有 1 000 个 输出 
端 〈 每 个 输出 端 对 应 一 种 物体 ) 。 假 设 图 片 分 辨 率 是 100x100=10 000 
像素 〈 很 低 的 分 辨 率 ) ， 如 果 这 部 机 器 只 有 三 层 神经 网 络 (深度 最 浅 
的 “深度 ”学 习 网 络 ) ， 输 入 端 和 中 间 层 之 间 ， 中 间 层 和 输出 之 间 的 连 
接 就 有 10 000x10 000+10 000x1 000=1.1 亿 个 。 也 就 是 这 部 机 器 有 1 亿 多 
个 旋钮 。 截 至 2017 年 ， 最 大 的 神经 网 络 已 经 号 称 有 上 万 亿 的 参数 ， 即 
上 万 亿 个 旋钮 。 这 么 多 旋钮 显然 无 法 用 人 工 去 调节 。 


田 里 下 山 : 训练 机 器 模型 


幸运 的 十 数学 上 200 年 前 束 有 了 “ 目 动 ”调节 旋钮 的 办 法 。 这 个 办 法 
叫 作 “ 最 陡 标 度 法 ”， 或 者 通俗 地 叫 作 “ 筋 里 下 山 法 ”。 当 我 们 训练 一 个 
机 器 学 习 模型 时 ， 我 们 事先 知道 每 一 张 图 片 是 什么 物体 (汽车 、 猫 等 
已 经 标注 的 图 片 ) ， 我 们 输入 汽车 图 片 时 ， 要 求 只 有 对 应 “汽车 ”的 那 
个 灯泡 最 腕 。 在 我 们 调节 旋钮 之 前 ， 灯 泡 的 竞 和 火 都 是 混乱 的 ， 和 我 
们 的 要 求 有 很 大 误差 。 这 些 误差 古 由 旋钮 的 值 决 定 的 。 如 采 把 这 些 误 
靶 画 成 一 幅 图 像 ， 就 像 图 3.6 一 样 有 很 多 山峰 ， 误 差 束 是 山峰 的 高 度 ， 
图 像 的 横 轴 和 纵 轴 整 古 旋钮 的 值 。 


J(6,,6 ) 


图 3.6 用 “最 陡 梯 度 法 ”寻找 误差 最 小 的 “山谷 ” 

图 片 来 源 ， 维 基 百 科 。 

当 我 们 输入 第 一 张 图 片 时 ， 我 们 可 能 站 在 一 个 随机 的 位 置 ， 例 如 
某 一 座 山 峰 的 山顶 或 半山 腰 ， 我 们 的 任务 吏 是 走 到 最 低 的 一 个 谷 撒 
(误差 最 小 。 我 们 此 时 相当 于 在 大 筋 中 被 困 在 山里 只 能 看 见 眼前 的 
山坡 ， 一 个 最 笨 的 办 法 就 古 “ 最 陡 下 降 法 ”站 在 原 地 转 一 圈 ， 找 到 一 
个 最 陡 的 下 山 方 癌 往 这 个 方 问 走 一 步 。 在 这 个 新 的 位 置 上 ， 再 转 一 图 
找到 最 陡 的 下 山 方向 再 走 一 步 ， 如 此 循环 ， 一 直 走 到 山脚 为 止 。 


在 “最 陡 下 降 法 ”中 每 次 转圈 找 最 陡 下 山 方向 相当 于 用 误差 印 数 的 
偶 微 分 方程 求 梯度 。 简 单 地 讲 ， 旋 钮 的 每 一 步 的 调 下 值 是 可 以 算出 来 
的 。 这 样 我 们 根据 输出 的 误差 一 步 一 步 地 算出 旋钮 的 调节 值 ， 直 到 满 
意 为 止 。 这 种 根据 误差 回头 调节 旋钮 的 方法 也 叫 “ 反 向 传播 算法 ”， 意 
思 是 用 输出 误差 一 层 一 层 地 从 输出 并 向 输 入 端 把 各 层 的 权重 系数 算出 
po 


AlphaGo 的 “上 带 视 角 ” 


有 了 上 面 的 基础 ， 我 们 现在 惑 可 以 理解 为 什么 AlphaGo 这 么 历 
害 。 围 棋 棋 盘 有 19x19=361 个 交 义 点 ， 每 个 交叉 点 可 以 二 选 一 : 白 子 
或 黑子 。 这 样 所 有 的 摆 法 就 是 2361， 或 者 10108 。 人 类 2 000 年 来 一 共 保 
留 下 来 的 围棋 残局 中 盘 大 约 3 000 万 个 。 人 类 下 过 的 棋局 相当 于 大 海里 
的 一 滴水 《即使 剔除 那些 明显 没有 意义 的 摆 法 ) 。 一 位 棋 手 即使 每 天 
下 2 盘 棋 ，50 年 内 天 天 下 ， 一 生 也 只 能 下 36 500 盘 槛 。 图 3.7 是 一 张 * 筋 
里 下 山 ” 的 示意 图 。 下 棋 的 终极 目标 相当 于 在 群 山 中 找到 最 低 的 合计 
(对 应 于 最 理想 的 走 法 ) 。 如 果 所 有 可 能 的 走 法 是 绵延 几 千 里 的 群 
山 ， 人 类 棋 手 2 000 年 来 就 相当 于 一 直 在 同一 个 小 山 均 里 面 打 转 转 。 第 
一 位 棋 手 偶然 的 棋 路 会 影响 他 的 徒弟 ， 以 后 的 徒 子 徒 孙 都 始终 在 这 个 
小 出场 附近 徘徊 。 而 机 器 学 习 像 个 “ 神 行 太 保 ”， 以 比 人 快 百 万 倍 的 速 
度 迅速 扫 通 群 山 ， 很 快 就 能 找到 一 个 远离 人 类 徘徊 了 2 000 年 的 更 低 的 
山谷 (可 能 还 不 是 绝对 最 低 ， 但 比 人 类 徘徊 处 低 ) 。 这 也 是 连 棋 圣 服 
卫 平 都 连 呼 “看 不 懂 ”AlphaGo 棋 路 的 原因 。 ( 见 图 3.7) 


人 类 2 000 年 来 徘徊 处 


下 ODE 


图 3.7 机 器 学 习 可 以 迅速 扫 过 群 山 找到 最 低 处 


这 个 原理 可 以 用 于 解决 许多 类 似 的 问题 。 这 类 问题 的 特点 是 变量 
常 多 ， 可 能 解 是 天 文 数字 ， 例 如 经 济 和 社会 决策 、 军 事 行动 策划 


自 民 


局 部 最 优 : 没 到 山 底 怎 么 办 


“ 粤 里 下 山 法 ”会 遇 到 一 个 问题 ， 束 是 会 走 进 一 个 不 是 最 低 的 谷 必 
而 且 再 也 走 不 出 来 了 。 用 一 维 函 数 能 清楚 地 看 到 这 个 问题 。 图 3.8 是 有 
两 个 “谷底 ?: A 点 和 B 扣 的 一 维 范 数 。 当 下 山 走 到 A 点 时 ， 只 要 每 次 的 


步伐 不 是 特别 大 ， 不 论 往 左 还 是 往 右 再 移动 ， 总 是 会 回 到 A 点 。 这 在 


数学 上 叫 “ 局 部 最 小 值 >， 而 B 点 才 是 “全 局 最 小 值 ?。 
起 始点 


局 部 最 小 值 
A 


全 局 最 小 值 


B 


图 3.8 有 两 个 谷底 的 一 维 画 数 


但 是 如 果 我 们 从 一 维 扩展 到 二 维 ， 就 有 可 能 从 一 个 “局 部 最 小 
值 ? 中 逃逸 。 在 图 3.9 中 ， 假 设 轴 数 1 是 一 个 治 X 轴 切 下 去 的 一 维 函 数 ， 
A 点 驳 是 函数 1 的 一 个 “局 部 最 小 值 ”。 如 采 一 个 小 珠子 只 能 沿 着 X 轴 滚 
动 ， 殊 会 陷 在 A 点 出 不 来 。 但 在 图 中 的 二 维 曲 面 上 ， 小 珠子 只 要 沿 着 Y 
轴 方 同 挪 动 一 点 ， 束 到 了 CC 点， 而 从 这 个 C 点 出 发 就 能 到 达 整 个 曲面 
的 “全 局 最 小 值 ” 冯 点 。 当 误差 男 数 的 维 数 增加 时 ， 这 种 从 “局 部 最 小 
值 ? 逃 逸 的 机 会 束 会 增 大 。 我 们 无 法 画 出 三 维 以 上 的 图 像 ， 但 我 们 可 以 
想象 每 个 “局 部 最 小 值 ? 附 近 都 有 许多 “* 虫 洞 ? 可 以 方便 逃 加 。 维 数 越 
高 ， 这 种 虫 洞 瓯 越 密集 ， 束 越 不 容易 陷 在 一 个 “局 部 最 小 值 " 里 。 


图 3.9 从 一 维 空间 扩展 到 二 维 空间 ， 误 差 画 数 找到 “全 局 最 小 值 "的 概率 增 大 
如 采 图 3.9 不 够 直观 ， 我 们 可 以 用 一 个 数字 阵列 来 表达 。 首 移 假 设 


地 形 是 一 个 一 维 函 数 ， 每 个 数字 表示 它 的 海拔 高 度 。 在 图 3.10 中 ， 有 
两 个 最 小 的 海拔 高 度 0 和 5， 但 是 无 论 从 哪 一 边 开 始 下 山 ， 每 走 一 步 的 
话 ， 都 会 被 困 在 高 度 5 这 个 “局 部 最 小 值 > 里 出 不 来 ， 无 法 走 到 “绝对 最 
小 值 ?0。 


| 


图 3.10 地 形 画 数 的 数字 阵列 


但 是 ， 如 果 将 这 个 地 形 玛 加 为 二 维 函 数 ， 仍 然 用 数字 表示 海拔 高 
度 ， 我 们 可 以 看 到 ， 无 论 从 哪 一 边 开 始 下 山 ， 每 走 一 步 ， 当 在 一 维 男 
数 中 走 到 “局 部 最 小 值 ”5 以 后 ， 在 为 外 一 个 维度 的 琅 数 中 ， 则 可 以 继续 
走 到 更 低 的 海拔 ， 直 到 a 到达“ 全 局 最 小 值 "0。 同 样 地 ， 维 度 越 多 ， 在 菏 
一 个 维度 到 达 “ 局 部 最 小 值 ” 后 ， 可 以 选择 的 其 他 维度 和 路 人 径 束 越 多 ， 
因此 被 困 在 “局 部 最 小 值 * 的 概率 就 越 低 。 ( 见 图 3.11) 


图 3.11 将 地 形 释 加 为 二 维 画 数 


深度 学 习 一 一 化 繁 为 简 


为 什么 深度 学 习 有 许多 层 神经 元 ?这 是 因为 世界 上 许多 信息 和 知 
识 是 可 以 通过 分 层 表 达 的 。 例 如 人 脸 是 很 复杂 的 一 幅 图 像 ， 但 人 脸 可 
以 先 分 解 成 五 官 ， 五 官 的 复杂 程度 就 比 人 脸 低 了 ， 五 官 义 可 以 进一步 
分 解 为 线条 。 深 度 学 习 就 是 用 一 层 神 经 元 去 识别 一 个 层级 的 信息 。 在 
图 3.12 中 ， 左 图 是 第 一 层 网 络 来 识别 人 脸 上 的 线条 ， 中 间 的 图 是 第 二 
层 网 络 在 识别 出 线条 的 基础 上 识别 出 器 官 ， 右 图 是 第 三 层 网 络 在 识别 
出 属 官 的 基础 上 识别 出 长 相 。 同 样 一 个 时 间 序 列 的 信息 ， 例 如 语音 也 
可 以 分 解 为 递 进 的 层级 : 句子 、 单 词 、 音 和 等 。 分 层 的 最 大 好 处 是 大 
大 降低 计算 量 ， 把 原来 的 N 次 计算 变 为 mxlogN 次 计算 ， 这 里 m 是 层 
数 。 

除了 将 要 处 理 的 信息 表达 为 层级 以 外 ， 另 外 一 种 降低 计算 量 的 方 
法 是 将 “一 大 块 > 信 息 分 解 为 许多 小 块 来 处 理 。 例 如 想 要 在 一 张 像素 很 
大 的 图 片 中 识别 出 一 个 小 三 角形 ， 我 们 只 需 拿 着 这 个 小 三 角形 的 模板 
在 大 图 中 滑动 比较 即 可 。 例 如 一 张 图 的 像素 是 1 000x1 000=1 000 
000， 如 果 拿 一 个 1 000x1 000 像 素 的 模板 去 比较 ， 计 算 量 大 约 是 1 000 


000x1 000 000。 如 果 这 个 三 角形 的 大 小 是 10x10， 我 们 用 10x10“ 模 板 
滑动 法 ”， 计 算 量 只 要 10x10x1 000 000， 是 原来 的 万 分 之 一 。 


WW 


图 3.12 深 度 学 习 神经 网 络 学 习 得 到 的 不 同 层次 的 特征 
图 片 来 源 : 维基 百科 。 
机 器 要 处 理 的 信息 有 些 是 空间 信息 ， 例 如 图 片 ， 有 些 是 时 间 信 
妃 ， 例 如 语音 。 针 对 不 同 的 信息 ， 神 经 网 络 的 结构 不 同 。 最 第 见 的 有 
两 种 ， 第 一 种 是 处 理 空间 信息 的 卷 积 神经 网 络 (Convolutional Neural 
Network，CNN) ， 第 二 种 是 处 理 时 间 信 息 的 循环 神经 网 络 (Recurrent 
Neural Network，RNN) 。 下 面 我 们 一 一 介绍 。 


化 整 为 零 的 眷 积 神 经 网 络 


“ 眷 积 "这 个 词 什 么 意思 行 会 明 们 再 讲 ， 但 现在 可 以 告诉 你 的 是 ， 
目前 人 工 智 能 和 机 絮 学 习 制 造 的 奇迹 ， 从 下 围棋 到 目 动 驾驶 再 到 人 上 脸 
识别 ， 背 后 全 是 卷 积 神经 网 络 。 能 知道 卷 积 神经 网 络 的 工作 原理 ， 你 
号 和 周围 大 部 分 读 了 几 本 人 工 知 能 的 书 的 人 不 古 一 个 档次 了 。 虽 然 大 
部 分 人 不 会 从 事 人 工 智 能 的 专业 工作 ， 但 卷 积 神经 网 络 解决 问题 的 思 

会 让 我 们 提案 叫绝 。 第 一 个 提出 卷 积 神经 网 络 的 是 前 面 说 的 神经 网 
络 教父 杰 莫 里 . 辛 顿 教 授 的 博士 后 学 生 ， 一 位 叫 宕 拉 孔 (Yan LeCun) 
的 法 国人 ， 现 在 任 Facebook ( 脸 书 ) 人 工 智能 研究 所 主任 ， 和 茸 顿 同 
为 神经 网 络 四 大 天 王 之 一 。 


降低 运算 量 吏 征 降低 成 本 


神经 网 络 每 一 层 的 每 一 个 神经 元 都 和 后 面 一 层 的 每 一 个 神经 元 相 
连接 。 如 果 第 一 层 有 1 万 个 神经 元 ， 第 二 层 也 有 1 万 个 ， 这 两 层 之 间 的 
连接 束 有 1 亿 个 。 如 有 果 像 微软 那个 一 举 超 过 人 脸 识别 图 像 能 力 的 ResNet 

(深度 残 差 网 络 ) 有 152 层 ， 这 些 连 接 就 有 151 亿 个 。 也 就 是 说 我 们 要 
调整 的 黑 盒 子 上 有 151 亿 个 旋钮 。 为 了 识别 10 种 动物 ， 要 给 训练 机 器 看 
10 万 张 动物 图 片 ， 一 张 图 片 束 要 算 151 亿 次 乘法 和 加 法 ，10 万 张 至 少 是 
1 500 万 亿 次 运算 。 这 才 是 识别 10 种 动物 的 训练 运算 量 ， 如 采 要 训练 识 
别 1 万 种 动物 呢 ? 用 今天 的 最 快 的 CPU (电脑 中 央 人 处 理 器 ) 或 GPU (图 
形 处 理 器 ) ， 也 要 算 几 个 月 甚至 几 年 。 对 计算 量 要 求 更 大 的 是 识别 ， 
识别 一 张 图 片 要 算 150 亿 次 不 难 ， 但 Facebook 上 每 天 上 传 的 何止 几 亿 张 
照 厂 ? 降低 运算 量 就 意味 着 降低 成 本 。 

降低 运算 量 的 第 一 招 惑 是 把 问题 分 类 ， 如 果 只 处 理 某 一 类 问题 ， 
针对 这 些 问题 的 共同 特点 ， 就 有 可 能 简化 算法 。 我 们 知道 ， 人 从 外 界 
获得 的 信息 90% 以 上 是 视 沉 信息 ， 视 党 信息 主要 是 图 像 ， 视 频 也 可 以 
分 解 成 快速 内 过 的 图 像 。 那 图 像 有 什么 特点 呢 ? 一 幅 图 像 的 信息 量 很 
大 ， 但 不 管 是 风景 还 是 人 物 ， 画 面 上 总 有 大 部 分 区 域 没 有 什么 变化 ， 
像 天 空 。 引 起 你 注意 的 东西 往往 都 是 一 小 块 ， 例 如 和 人 的 眼睛 、 天 至 中 
的 鸟 、 地 上 的 花 。 这 个 叫 作 图 像 中 信息 的 局 域 性 。 图 像 的 第 二 个 特点 
是 可 以 分 解 为 更 简单 的 元 素 ， 例 如 风景 分 解 为 天 空 、 大 地 、 植 物 、 动 
物 ， 人 物 分 解 为 五 官 。 卷 积 神经 网 络 就 是 利用 图 像 的 以 上 两 个 特点 进 
行 了 大 幅度 的 运算 简化 。 

以 人 脸 识别 为 例 ， 要 识别 一 个 人 ， 先 要 抓 住 他 的 特征 ， 比 如 浓 眉 
大 上 腿 高 盟 梁 。 第 一 步 束 是 把 五 官 找 出 来 。 其 实 警 察 抓 犯罪 嫌疑 人 时 就 
用 了 这 一 招 。 和 警察 局 的 画师 会 问 目击 者 犯罪 嫌疑 人 的 性 别 、 年 龄 、 导 
高 、 种 族 等 ， 然 后 问 目击 者 犯罪 嫌疑 人 的 五 官 长 什么 样 ， 目 击 者 能 摘 
述 的 五 官 种 类 非常 有 限 ， 大 眼睛 、 小 眼睛 ， 最 多 加 个 单眼 皮 、 双 眼 


` 高 恰 荣 、 场 蛤 架 ， 根 据 目 击 者 的 描述 画师 画 出 一 幅 人 脸 ， 然 后 目 
击 者 再 说 眼角 朝 下 ， 没 这 么 大 ， 男 师 再 不 断 改 ， 直 到 目击 者 觉得 和 记 
忆 基 本 相符 。 人 脸 那 么 复杂 根本 无 法 用 语言 描绘 ， 但 如 果 变 成 五 官 的 
组 合 摘 绘 起 来 束 们 单 多 了 。 假 设 每 个 五 官 都 能 分 10 种 ， 丈 能 组 合 出 1 万 
种 脸 来 ， 再 加 上 年 龄 、 性 别 、 种 族 就 能 组 合 出 几 十 万 张 脸 ， 这 样 把 从 
70 亿 人 中 找 一 张 脸 的 任务 就 分 解 成 了 从 10 种 眼睛 中 找 出 一 种 眼睛 ， 再 
从 10 种 异 子 中 找 出 一 种 时 子 这样 简 单 得 多 的 任务 。 


苍 积 神经 网 络 是 走样 工作 的 


卷 积 神经 网 络 就 古 用 的 警察 局 这 一 招 。 假 如 我 们 现在 要 从 分 布 在 
北京 大 街 小 埠 的 摄像 头 的 视频 中 发 现 100 个 重要 的 犯罪 嫌疑 人 ， 第 一 步 
是 用 这 些 犯 罪 嫌疑 人 的 已 有 照片 来 训练 机 器 。 训 练 的 第 一 步 就 是 要 从 
这 些 照片 中 提取 五 官 的 特征 。 因 为 五 官 在 一 张 照片 中 只 占 一 小 块 ， 那 
我 们 整 做 个 找 五 冒 的 小 模板 ， 专 业 术 语 叫 滤波 侨 ， 用 这 个 小 模板 在 要 
处 理 的 图 像 上 从 左 扫 到 右 ， 从 上 扫 到 下 ， 看 看 能 否 发 现 眼 睛 ， 男 外 一 
个 小 模板 负责 发 现 鼻 了 等。 什么 叫 " 发 现 鼻子 ”? 束 古 负责 发 现 蜡 子 的 
小 模板 是 一 张 像 蜡 于 的 图 案 ， 这 个 图 案 扫 到 蜡 子 处 时 重合 度 最 大 。 什 
么 叫 提取 特征 ? 就 是 一 开始 这 个 蜡 了 于 图 案 古 个 随机 图 案 , 像 古 随手 那 
么 一 画 ， 扫 一 授 下 来 发 现 没 有 什么 重合 度 ， 那 束 变 一 变 这 个 图 案 ， 最 
后 变 得 和 犯罪 嫌疑 人 的 蜡 子 很 像 时 ， 重 合 度 开 会 最 大 。 等 负 贡 找 出 蜡 
子 、 有 眼睛 、 嘴 巴 等 的 模板 图 案 都 和 犯罪 嫌疑 人 的 吻合 后 束 算 训练 成 功 
了 。 以 后 你 输入 一 张 照片 ， 机 器 就 可 以 飞速 地 告诉 你 这 个 是 不 是 犯罪 
嫌疑 人 。 

在 机 亏 学 习 中 ， 有 是 机 域 目 己 寻找 特征 。 一 开始 机 大 并 不 知道 要 找 
哪些 特征 。 所 以 这 些小 模板 并 不 知道 它们 要 找 具 子 或 眼睛 。 这 些小 模 
板 从 开始 的 一 个 随机 图 形 到 最 后 一 定 会 演变 成 五 官 吗 ? 答案 是 如 采 五 
官 是 人 脸 上 最 重要 的 特征 ， 这 些小 模板 到 最 后 一 定 会 演变 成 五 官 。 但 


神奇 的 是 机 器 还 能 发 现 我 们 人 类 都 没 注 意 到 的 人 脸 上 的 重要 特征 。 假 
如 我 们 多 加 一 个 小 模板 变 成 六 个 ， 这 六 个 中 会 有 五 个 各 自 对 应 一 个 器 
官 ， 还 有 一 个 就 会 找到 一 个 新 的 特征 ， 如 两 眼 之 间 的 距离 ， 或 者 口 鼻 
之 间 的 距离 ， 等 等 。 所 以 小 模板 越 多 ， 抓 到 的 特征 就 越 多 ， 识 别 就 越 
准确 。 

现在 你 要 问 ， 这 个 小 模板 发 现 鼻 子 和 前 面 讲 的 神经 网 络 黑 盒子 的 
调 旋钮 是 什么 关系 ? 其 实 这 个 小 模板 就 是 一 组 旋钮 ， 一 个 有 5x5=25 个 
像素 的 小 模板 就 相当 于 25 个 旋钮 ， 每 个 像素 的 颜色 浓度 对 应 着 一 个 旋 
钮 的 某 个 位 置 ， 调 旋钮 就 是 让 小 模板 里 的 图 案 越 来 越 像 犯罪 嫌疑 人 的 
鼻子 。 我 们 之 前 讲 过 ， 这 个 “ 调 旋 钮 "不 是 人 工 调 的 ， 是 算出 来 的 。 

现在 我 们 可 以 看 看 到 底 省 了 多 少 计算 量 ， 如 果 一 张 图 片 是 1 024x1 
024s100 万 像素 ， 每 个 像素 对 应 一 个 接收 神经 元 ， 每 层 有 100 万 个 神经 
元 ， 这 样 一 个 全 连接 的 神经 网 络 每 一 层 要 有 100 万 x100 万 =1 万 亿 次 计 
算 。 现 在 只 要 五 个 小 模板 ， 每 个 负责 找到 五 官 中 的 一 个 。 每 个 小 模板 
把 图 片上 下 左右 扫 一 遍 的 计算 量 是 5x5x100 万 =2 500 万 次 ，5 个 模板 就 
是 1.25 亿 次 。 计 算 量 变 成 了 原来 的 万 分 之 一 ! 

我 现在 可 以 告诉 你 什么 叫 “ 卷 积 ， 上 面 说 的 小 模板 把 图 片上 下 左 
右 横 扫 一 遍 发 现 重合 度 的 过 程 束 叫 卷 积 。 你 看 这 个 路 人 的 黑 科 技 名 词 
其 实 就 是 这 么 简单 的 一 回 事 。 

上 面 是 对 卷 积 神经 网 络 的 基本 原理 的 一 个 通俗 解释 。 对 于 想 更 深 
入 了 解 的 读者 可 以 看 附录 1 中 一 个 典型 郑 积 网 络 的 精确 摘 述 。 从 附录 1 
中 可 以 看 出 卷 积 神经 网 络 不 仅 是 一 个 高 阶 的 非 线 性 网 络 ， 也 是 一 个 无 
法 用 方程 式 表达 的 函数 。 给 定 一 个 训练 数据 集 ， 最 后 这 些 数 据 之 间 的 
相关 性 都 会 凝结 在 网 络 参 数 里 。 或 者 说 神经 网 络 是 数据 相关 性 的 “萃取 
器 *。 但 琳 取 了 哪些 相关 性 ? 为 什么 萃取 这 些 相 关 性 则 是 人 们 未 必 能 理 
解 的 。 比 如 人 脸 识别 ， 机 器 抓 取 的 用 于 识别 的 人 脸 特 征 可 能 是 人 类 不 
熟悉 的 那些 特征 ， 甚 至 完全 没有 意识 到 的 特征 。 对 于 那些 人 类 感官 无 


法 感受 的 复杂 数据 集 ， 比 如 一 个 核电 三 成 和 上 万 个 子 系统 产生 的 数据 
以 及 它们 之 间 的 相关 性 ， 那 更 是 人 类 完全 无 法 理解 的 。 


郑 积 神经 网 络 能 做 哪些 事 


首 移 ， 几 乎 所 有 的 图 像 类 的 处 理 ， 如 图 像 分 类 、 人 脸 识别 、X 光 
读 片 ， 部 适合 用 卷 积 神经 网 络 。 图 像 分 类 最 得 名 的 大 赛 束 古 斯 坦 福 大 
学 李 飞 飞 教 授 创办 的 ImageNet (计算 机 视觉 系统 识别 项 目 ， 是 目前 世 
界 上 图 像 识别 最 大 的 数据 库 ) 大 赛 。 这 个 大 赛 提供 1 000 种 不 同 物体 的 
几 百 万 张 图 片 让 参赛 者 训练 目 己 的 模型 ， 参 赛 时 给 大 家 一 些 狐 的 图 片 
让 参赛 者 识别 ， 看 谁 的 识别 准确 率 最 口 。2012 年 辛 顿 的 学 生 亚 历 克 斯 : 
克 里 捷 夫 斯 基 (Alex Krizhevsky) 第 一 次 用 一 个 5 层 的 卷 积 神经 网 络 就 
把 多 年 徘徊 在 74% 的 准确 率 一 举 提 高 到 849%， 震 怀 了 业界 。 到 2015 年 
微软 的 152 层 ResNet 把 准确 率 提 高 到 了 96% ， 超 过 了 人 类 的 准确 率 
959%6。 从 那 以 后 进展 就 越 来 越 小 。 有 些 公司 组 织 大 量 的 人 力 ， 采 集 更 
多 的 训练 图 片 ， 笑 试 更 多 的 小 模板 ， 更 精心 地 微调 那些 旋钮 ， 最 后 能 
达到 比 现 有 结果 好 0.19%6， 然 后 吏 可 以 宣称 目 己 是 世界 第 一 了 。 但 这 个 
世界 第 一 意义 不 大 ， 因 为 没有 在 网 络 结构 上 和 算法 上 有 任何 创新 ， 当 
时 人 家 一 个 研究 生 Alex 一 举 提 高 10 个 百分点 ， 你 扑 上 去 几 十 上 百人 提 
高 0.1 个 百分点 ， 不 算 本 事 。 对 不 懂 卷 积 神经 网 络 的 投资 人 、 股 民 、 政 
府 官员 来 说 ， 这 块 * 世 界 第 一 ”的 牌子 还 挺 距 人 的 。 但 读 到 这 里 你 以 后 
器 不 会 被 忽悠 了 。 

更 有 用 的 是 通过 识别 一 张 图 片 中 所 有 的 物体 ， 甚 至 发 现 物体 之 间 
的 关系 来 “理解 ”这 张 图 片 。 璧 如 机 器 看 完 一 张 图 片 后 会 说 出 来 “蓝天 日 
云 下 ,一 位 戴 草 帽 的 年 轻 妈 妈 在 草地 上 教 孩 子 学 走路 ， 她 们 的 小 狮子 
狗 在 旁边 卧 厦 ”。 

X 光 读 片 也 是 卷 积 神经 网 络 一 个 很 好 的 应 用 。 假 如 要 在 胸 片 中 发 
现 早期 肺癌 ， 就 需要 拿 大 量 已 经 确诊 的 早期 肺癌 片子 来 训练 机 器 ， 这 


样 训 练 好 的 机 赤 就 可 以 快速 地 发 现 肺 瘤 。 随 着 X 光 仪 、CT 机 等 医疗 成 
像 设备 的 普及 ， 有 经 验 的 读 片 医生 非常 稀缺 。 特 别 是 在 小 城市 、 县 
城 、 乡 村 更 缺乏 这 样 的 好 医生 。 如 采 机 器 读 片 能 够 达到 甚至 超过 北 
泉 、 上 海 大 医院 有 经 验 的 医生 ， 将 是 普 患 医疗 的 一 个 巨大 进展 。 我 们 
在 第 六 草 会 专门 讲 AI 在 医疗 健康 领域 的 应 用 ， 包 括 X 光 读 片 的 现状 和 
挑战 。 

卷 积 神经 网 络 虽然 应 用 很 广 ， 但 它 解 决 不 了 一 些 重要 的 问题 ， 如 
股票 预测 和 目 然 语言 理解 。 下 面 我 们 避 ® 介 绍 可 以 解决 这 类 问题 的 男 一 
个 很 牛 的 网 络 。 


处 理 序 列 信息 的 循环 神经 网 络 


为 什么 需要 循环 神经 网 络 


卷 积 神经 网 络 可 以 处 理 图 像 分 类 和 识别 。 图 像 信息 处 理 的 特点 十 
一 张 图 像 的 所 有 信息 同时 给 你 ， 而 且 下 一 张 图 像 和 上 一 张 图 像 可 以 完 
全 没有 关系 ， 台 像 症 号 一 一 饺子 ， 先 吃 哪个 后 吃 哪 个 都 无 所 谓 。 但 目 
然 界 还 有 男 外 一 类 信息 和 图 像 不 同 ， 信 息 的 先后 顺序 很 重要 ， 不 能 前 
后 颠倒 ， 像 目 然 语言 、 股 票 曲 线 、 天 气 预报 数据 等 。 和 图 像 信 息 的 羽 
一 个 不 同 之 处 在 于 这 些 信息 是 连续 产生 的 ， 无 法 分 成 一 块 一 块 的 ， 像 
次 喝 进 去 一 瓶 啤酒 ， 你 无 法 清楚 地 分 成 几 十 “ 口 ?， 你 束 是 这 么 咕 哪 
咕嘟 连 着 灌 下 去 的 。 我 们 把 图 像 这 样 不 分 先后 的 信息 称 为 “空间 信 
思 ”， 把 连续 的 、 有 先后 顺序 的 称 为 “时间 信息 ?或 “序列 信息 ”。 卷 积 神 
经 网 络 每 次 能 处 理 的 信息 都 是 个 固定 的 量 ， 所 以 不 适合 处 理 连 续 发 生 
的 信息 。 


于 是 ,一 种 不 同 的 神经 网 络 一 一 循环 神经 网 络 束 应 运 而 生 了 ， 它 
的 结构 比 卷 积 神 经 网 络 还 复杂 。 但 循环 网 络 背后 的 直觉 和 道理 不 难 
全， 其 实 掌握 一 门 学 科 最 重要 的 是 理解 背后 的 直觉 ， 有 些 研究 生 、 工 
程 师 可 以 背 很 多 方程 式 ， 写 很 多 程序 ， 但 对 背后 的 直觉 并 不 清晰 ， 这 
束 大 大 限制 了 他 们 的 想象 力 和 创造 力 。 我 们 这 本 书 的 目的 不 是 要 把 大 
家 训练 成 工程 师 ， 而 是 通过 弄 懂 背后 的 道理 来 对 这 个 未 来 的 大 潮流 有 
高 屋 建 领 的 理解 ， 从 而 产生 全 局 性 的 把 握 。 

在 介绍 循环 神经 网 络 之 前 ， 我 们 先 看 个 例子 。 壁 如 我 们 在 下 面 的 
句子 里 猜 词 填空 : “我 是 广东 人 ， 会 讲 话 。” 在 这 里 如 有 果 我 们 没有 
看 到 第 一 句 “ 我 是 广东 人 ”就 很 难 填 空 。 这 束 是 一 个 典型 的 根据 前 面 出 
现 的 信息 对 后 面 可 能 会 出 现 的 信息 的 预测 。 循 环 神经 网 络 吏 特 别 适 合 
处 理 这 类 问题 。 这 个 网 络 有 两 个 特点 ， 分 别 对 应 时 间 序 列 信息 的 两 个 
特点: 一 是 输入 端 可 以 接收 连续 的 输入 ， 二 是 可 以 记 住 信息 的 先后 顺 
有 


循环 神经 网 络 背 后 的 直觉 


现在 我 们 看 看 循环 神经 网 络 如 何 做 这 样 的 预测 。 像 其 他 神经 网 络 
一 样 ， 第 一 步 是 训练 机 和 器。 我 们 和 一 句 一 句 地 训练 ， 比 如 训练 的 第 一 
句 吏 是“ 我 是 上 海 人 ， 会 讲 上 海 话 ”。 一 开始 训练 机 器 时 ， 给 机 需 一 
个 “我 ? 字 ， 机 需 会 乱 预测 ， 比 如 预测 出 下 个 字 是 介词 “但 ”， 可 “我 
但 ” 没 意 义 。 机 器 和 训练 样本 一 比 知道 自己 错 了 ， 束 去 调 黑 盒子 上 的 旋 
钮 ， 一 直 调 到 机 需 会 在 “我 "后面 预 测 出 “是 ?来 。 训 练 号 是 这 样 给 机 天 
读 大 量 的 各 种 各 样 的 名和 于 ， 当 机 融 读 了 很 多 以 “我 ?开始 的 句子 时 ， 丈 
会 发 现 “ 我 "后面 一 定 是 动词 ， 特 别 是 关系 动词 或 能 愿 动词 ， 像 “我 
征 交 我 要 ”。 但 “我 "后面 可 以 有 很 多 动词 , “我 想 ”“ 我 吃 交 我 喝 ”， 到 确 
选 哪个 呢 ? 这 天 需要 更 前 面 的 信息 了 。 所 以 循环 神经 网 络 要 人 存储 前 面 
的 信息 。 当 机 器 读 了 很 多 “我 是 上 海 人 ， 会 讲 上 海 话 “ 我 是 河南 人 ， 会 


讲 河 南 话 ” 这 类 的 句子 后 ， 束 会 慢 慢 发 现 规 律 ， 这 时 候 你 让 它 填 “ 我 是 
广东 人 ， 会 讲 。 _ 话 ”的 空 时 ， 它 就 把 我 是 “什么 "人 那个 “什么 ”给 填 
有 二 的 

这 时 候 你 会 问 ， 这 好 像 不 用 这 么 复杂 的 神经 网 络 吧 ， 只 要 统计 每 
个 词 后 面 出 现 的 词 的 概率 ， 然 后 预测 哪个 概率 最 高 不 惑 得 了 ? 过 去 的 
确 是 这 么 做 的 ， 但 效 采 不 好 ， 像 我 们 前 面 举 的 例子 , “我 "后面 的 可 能 
性 太 多 了 “。 那 你 会 接着 说 : “我 们 也 统计 前 面 更 多 的 字 不 就 得 了 ? " 那 
我 问 你 ， 统 计 前 面 多 少 个 字 呢 ? 要 不 要 把 词组 和 短 句 也 作为 一 个 单位 
来 统计 ? 但 词组 和 短 句 多 得 数 不 清 ， 你 怎么 教会 机 器 认识 哪些 生词 
组 ?你 会 发 现 越 深究 问题 束 越 多 ， 而 且 问 题 变 得 无 穷 复杂 ， 以 至 于 部 
不 知道 该 提取 哪些 特征 。 而 神经 网 络 可 以 目 动 找到 那些 人 类 找 不 到 的 
或 者 根本 没 意 识 到 的 前 后 信息 之 间 的 相关 性 。 整 像 我们 之 前 讲 到 卷 积 
神经 网 络 不 仅 能 找到 人 脸 的 五 官 特征 ， 还 能 找到 人 平时 不 注意 的 其 他 
特征 如 两 眼 间距 等 。 


有 兴趣 的 读者 可 以 看 附 孙 2 里 面 关 于 循环 神经 网 络 的 技术 介绍 。 从 
附录 2 里 可 以 看 出 由 于 循环 神经 网 络 里 有 反馈 回路 ， 整 个 网 络 更 是 一 个 
高 度 非 线性 、 无 法 解析 表达 的 网 络 。 循 环 网 络 萃取 出 的 数据 在 时 间 上 
的 相关 性 更 是 人 类 无 法 感受 和 理解 的 瞳 知识 。 因 为 人 脑 非常 不 善于 存 
储 很 长 一 段 时 间 的 信息 。 


循环 神经 网 络 的 神 柯 应 用 


循环 神经 网 络 的 第 一 个 重要 应 用 钙 机 器 翻 译 。 机 器 翻译 最 早 钙 语 
语 学 家 手工 写 一 大 堆 语 法 ， 然 后 根据 单词 出 现 的 顺序 用 语法 把 它们 组 
织 起 来 。 这 古典 型 的 “专家 系统 ”。 我们 前 面 讲 过 ， 这 样 的 手工 系统 无 
法 应 付 千 变 万 化 的 目 然 语言 。 后 来 的 机 天 学 习 翻 译 殉 是 前 面 说 过 的 统 
计 方 法 ， 统 计 大 量 的 句子 中 每 个 宇 出 现在 尹 外 一 个 字 之 后 的 频率 ， 然 
后 挑选 最 可 能 出 现 的 那个 字 。 我 们 前 面 也 说 了 这 种 方法 的 局 限 性 。 现 


在 最 新 、 最 牛 的 机 器 翻译 ， 从 谷歌 、Facebook、 微 软 到 百度 统统 都 是 
用 循环 神经 网 络 。 翻 译 和 前 面 的 填空 例子 相 比 ， 多 了 可 用 的 信息 。 例 
如 英文 “Iam Chinese，I can speak mandarin” 可 以 翻译 成 中 文 “我 是 中 

， 会 讲 普 通话 ?"， 机 器 翻译 除了 可 以 根据 前面 出 现 的 中 文 词 预 测 后 面 
的 中 文 词 之 外 ， 还 可 以 根据 整个 英文 句子 和 整个 中 文句 子 之 间 的 对 应 
关系 来 提高 预测 的 准确 性 。 这 葡 是 目前 最 广泛 使 用 的 “编码 器 -解码 
融 ” 翻 译 模 型 。 这 里 用 两 个 循环 神经 网 络 ， 一 个 网 络 先 把 整个 英文 句子 
的 结构 信息 都 压缩 到 一 个 字符 中 ， 然 后 第 二 个 网 络 在 一 个 字 一 个 字 地 
预测 时 可 以 根据 这 个 包含 了 整个 句子 的 结构 信息 做 辅助 判断 。 机 需 翻 
译 正 处 在 技术 突破 的 边缘 ， 一 旦 突破 将 给 我 们 的 生活 带 来 巨变 。 


机 器 学 习 不 仅 在 科学 技术 的 进步 上 大 显 神 威 ， 也 开始 进入 人 文 领 
域 。 循 环 神经 网 络 第 二 个 有 意思 的 应 用 是 写 诗 。 我 们 会 在 第 六 章 中 庄 
细 介 绍 。 同 样 的 道理 ， 还 可 以 写 小 说 。 只 要 让 机 需 大 量 阅 读 一 位 作者 
的 著作 ， 机 顺 吏 会 学 会 这 个 作者 的 文字 风格 ， 甚 至 可 以 写 出 海明威 风 
格 的 《红楼 梦 》， 或 者 草 雪 并 风格 的 《老人 与 海 》。 


循环 神经 网 络 很 神奇 ， 但 我 们 下 面 要 介绍 的 “强化 学 习 ? 更 神奇 。 


AlphaGo 与 强化 学 习 


机 俩 学 习 迄 今 为 止 最 让 人 类 惊奇 的 表现 加 是 下 围棋 。 下 围棋 的 问 
题 定 当 我 每 走 一步 时 ， 如 何 使 得 最 终 蜂 棋 的 概率 最 大 ? 如 采 我 不 走 150 
步 ， 只 走 两 步 ， 每 步 双 方 只 随机 选 5 种 走 法 ， 我 走 第 一 步 有 五 种 选择 ， 
对 方 对 我 这 五 种 选择 的 每 一 种 又 有 五 种 选择 ， 我 走 第 二 步 一 共有 
5x5x5=125 种 选择 。 但 通常 走 完 两 步 离 终局 还 很 还 ， 那 我 从 走 完 第 二 
步 的 这 125 个 位 置 上 各 派出 一 批 * 侦 察 兵 "， 每 个 “侦察 兵 ” 窜 着 头 一 条 道 
走 到 黑 ， 看 到 贫 路 任 选 一 条 ， 尽 快走 到 终局 ， 如 采 猜 对 了 ， 给 这 个 出 
发 点 加 一 分 ， 猜 错 了 ， 减 一 分 。 从 每 个 位 置 上 涛 出 的 "侦察 兵 " 越 多 ， 


从 这 125 个 出 发 点 到 终局 的 恬 率 承 越 准确 。 这 个 “有 限 出 发 点 ， 随 机 侦 
察 ” 的 方法 有 个 路 人 的 专业 名 字 叫 "蒙特 卡 洛 树 搜 索 ”。 家 特 卡 阁 是 摩 纳 
哥 的 财 场 区 ， 所 以 花 特 卡 阁 吏 是 “随机 ”的 意思 。 


但 这 种 下 棋 策 略 只 能 勉强 达到 一 二 段 的 业余 水 平 ， 与 围棋 大 师 相 
比 还 差 得 很 远 。 为 什么 ? 

因为 “侦察 兵 ” 往 前 走时 随机 选 盆 道 实际 上 是 随机 地 替 对 方 选 了 走 
法 。 我 们 不 禁 会 想到 : 见 到 岔路 随机 选 多 尝 ， 完 全 可 以 根据 阳光 、 登 
各 、 足 迹 这 些 东 西 做 个 判断 。“ 侦 察 兵 ”很 委屈 地 说 : 我 怎么 知道 该 怎 
样 判 断 ? AlphaGo 寻 思 说 : “人 类 2 000 多 年 下 了 那么 多 盘 棋 ， 咱 能 不 能 
先 学 学 ? ”这 时 候 AlphaGo 祭 出 了 大 法 絮 ， 束 是 我 们 前 面 讲 过 的 卷 积 神 
经 网 络 。 

卷 积 神经 网 络 最 适合 处 理 图 像 ， 经 过 大 量 图 片 的 训练 后 ， 你 给 它 
个 新 的 图 片 ， 它 告诉 你 是 猫 、 狗 、 汽 车 的 概率 分 别 有 多 少 。 对 于 下 
棋 ， 问 题 转化 成 : 给 个 中 盘 ， 要 判断 哪 种 走 法 启 的 概率 最 大 。 在 人 类 
下 过 的 棋局 中 ， 每 个 中 副 都 对 应 着 一 个 走 法 。 现 在 可 以 把 一 个 中 副 看 
成 一 幅 图 像 ， 把 对 应 的 走 法 看 成 与 这 个 图 像 对 应 的 物体 。 现 在 找到 中 
盘 最 好 的 走 法 就 相当 于 判断 这 幅 图 像 最 像 哪 个 物体 。 那 我 惑 拿 人 类 下 
过 的 棋局 来 训练 AlphaGo 里 负责 走 子 的 卷 积 神经 网 络 一 决策 网 络 。 
现在 把 3 000 万 个 人 类 走 过 的 中 副 输入 给 决策 网 络 ， 调 整 决策 网 络 上 的 
旋钮 ， 一 直到 这 个 网 络 的 走 法 和 人 的 走 法 类 似 。 现 在 AlphaGo 已 经 是 
七 八 段 的 水 平 了 ， 但 还 打 不 过 大 师 ， 为 什么 ? 虽然 现在 “侦察 兵 ” 每 一 
步 都 是 按 人 类 的 走 法 ， 但 “侦察 兵 ” 的 每 一 步 只 是 蔡 对 方 随机 选 一 个 。 
如 采 能 让 对 方 的 选择 也 按 人 类 的 走 法 ， 这 条 路 对 奔 下 去 承 更 盟 真 了 。 
AlphaGo 这 时 候 拔 了 号 上 一 根 毫 毛 ， 吹 口 仙 气 儿 ,“ 变 ! ”又 * 变 ”出 一 个 
一 模 一 样 的 AlphaGo。 哥 俩 都 是 八 段 ， 再 大 战 百 万 回合 ， 又 摸索 出 很 
多 原 米 人 类 没有 探索 过 的 捷径 ， 又 产生 了 很 多 数据 ， 继 续 训练 决策 网 
络 ， 没 多 长 时 间 就 打败 了 李 世 石 ， 再 练 一 阵子 ， 在 网 上 打出 Master 的 
旗号 ， 横 扫 天 下 高 手 ， 无 一 失手 ， 直 至 把 柯 洛 挑 下 马 。 


前 面 介 绍 的 无 论 是 卷 积 神经 网 络 还 是 循环 神经 网 络 都 需要 大 量 的 
训练 数据 ， 这 也 叫 “ 监 督学 习 ”。 在 “监督 学 习 ” 中 通常 有 唯一 或 明确 的 
答案 ， 猪 殴 是 猫 ， 狗 束 是 狗 。 但 生活 中 还 有 一 类 问题 定 没 有 明确 答案 
的 。 例 如 我 们 学 习 骑 目 行车 ， 没 有 人 能 说 清楚 正确 姿势 是 什么 ， 不 管 
你 姿势 多 难看 ， 骑 上 去 不 控 倒 就 十 对 的 。 这 类 问题 的 特点 是 人 管 案 不 唯 
一 但 知道 结 末 的 对 错 。 这 种 通过 每 次 结果 的 反馈 逐 半 学习 正 确 “ 行 
为 ”的 算法 束 叫 “强化 学 习 ”。 在 强化 学 习 算 法 中 有 一 个 “ 奖 您 琅 数 ”"， 不 
同 的 行为 会 得 到 不 同 的 奖惩 。 壁 如 我 们 在 楼 里 打 电 话 时 ， 如 采信 号 不 
好 ， 我 们 就 拿 厦 手 机 ， 边 走边 问 对 方 “ 能 听 到 吗 ? ”。 我们 得 到 的 信息 
并 不 能 直接 告诉 我 们 哪里 信号 最 好 ， 也 无 法 告诉 我 们 下 一 步 应 该 往 哪 
个 方向 走 ， 每 一 步 的 信息 只 能 让 我 们 评估 当前 的 状况 是 更 好 还 十 更 
关 。 我 们 需要 走动 、 测 试 ， 以 决定 下 一 步 应 该 往 哪儿 走 。AlphaGo 的 
随机 树 搜 索 束 是 强化 学 习 ， 通 过 派出 "侦察 兵 ” 来 测试 某 种 走 法 的 电 
率 。 顾 了 加 一 分 ， 输 了 减 一 分 ， 这 承 是 强化 学 习 中 的 奖惩 画 数 ， 存 储 
各 种 走 法 输 启 积分 的 网 络 也 叫价 值 网 络 ”。 哥 俩 对 战 束 是 站 在 人 类 忆 
膀 上 的 强化 学 习 。 所 以 AljphaGo 坪 监督 学 习 和 强化 学 习 的 混合 方式 。 


在 AlphaGo 的 学 习 过 程 中 ， 人 类 的 3 000 万 中 副 仪 仅 把 它 领 入 门 而 
已 ， 进 步 主要 靠 哥 俩 目 己 扬 杀 。 相 当 于 你 去 学 围棋 ， 一 开始 跟着 你 爸 
学 ， 你 爸 束 是 个 业余 选手 ， 你 两 个 星期 就 跟 你 爸 学 不 了 什么 了 ， 以 后 
都 要 靠 自 己 琢磨 了 。AlphaGo 也 一 样 ， 想 清楚 这 操 ， 干 脆 从 和 零 开始 ， 
人 类 2 000 多 年 积累 的 东西 也 许 惑 是 老 爸 那 点 业余 水 平 ， 学 不 学 无 所 
谓 。AlphaGo Zero 横 空 出 世 了 ， 这 个 “Zero” 束 是 从 零 学 起 的 意思 。 
AlphaGo Zero 从 一 开始 就 是 哥 俩 目 娱 目 乐 ， 和 AlphaGo 不 同 的 是 ， 在 下 
每 一 步 棋 之 前 ， 不 需要 随机 地 选 125 个 出 发 点 了 ， 而 是 根据 当前 的 小 
路 “记号 ”和 打分 先 在 这 个 中 盘 选 一 个 最 可 能 蜂 的 走 法 和 “双胞胎 弟 
第 ” 试 走 一 次 到 终局 ， 试 走 过 程 中 每 一 步 双方 都 用 同一 个 决策 网 络 指导 
如 何 走 子 。 这 个 决策 网 络 的 功能 很 简单 : 给 我 一 个 中 盘 ， 我 告诉 你 所 
有 走 法 的 启 率 ， 这 样 一 次 到 终局 后 丈 对 从 这 个 走 法 出 发 的 路 是 否 能 顾 
多 了 点 信息 。 一 路 上 边 走 边 做 记号 ， 第 一 ， 记 住 有 没有 走 过 这 条 路 ; 


第 二 ， 等 到 了 终局 后 根据 输赢 再 记 下 这 条 路 的 好 坏 。 这 个 “做 记号 ?就 
是 不 断 更 新 价值 网 络 。 这 样 在 同一 个 中 盘 哥 俩 试 走 了 儿 万 次 到 终局 ， 

基本 摸 清 哪 条 路 好 走 ， 哪 条 路 不 好 走 ， 也 就 是 对 于 这 个 中 强 我 已 经 估 
摸 出 了 所 有 走 法 的 局 率 。 此 时 ， 我 用 几 万 次 试 走出 来 的 局 率 来 更 新 决 
策 网 络 。 更 痢 的 方法 就 是 用 这 个 中 强 做 网 络 的 输入 ， 调 试 网 络 权重 系 
数 让 输出 的 各 走 法 赢 率 接近 试 走 测 出 来 的 赢 率 。 这 一 切 做 完 后 再 根据 
测 出 的 赢 率 郑重 地 正式 走 一 步 棋 。 哥 哥 下 完 一 步 该 弟弟 走 了 ， 弟 弟 的 
程序 和 哥哥 完全 一 样 ， 也 是 移 试 走 许多 次 ， 用 测 出 来 的 赢 率 更 新 决策 
网 络 ， 再 根据 测 出 来 的 启 率 走 和 于 。 以 后 哥 俩 就 这 么 不 断 重 复 下 去 。 
AlphaGo Zero 诞 生 后 的 第 一 局 的 第 一 个 中 盘 ， 哥 俩 完全 是 乱 下 ， 但 第 
一 盘 走 完 束 多 了 一 点 点 知识 ， 哥 俩 用 这 点 可 怜 的 知识 走 第 二 强 残 比 第 
一 盘 靠 谱 了 一 点 点 ， 架 不 住 计 算 能 力 强 大 ，AlphaGo Zero 每 秒 钟 可 以 
走 8 万 步 ， 平 均一 盘 棋 不 到 400 步 ， 所 以 哥 俩 一 秒 钟 相当 于 下 200 盘 棋 。 
每 盘 长 进 一 点 ， 到 第 7 个 小 时 ， 也 就 是 相当 于 下 了 500 万 副 棋 后 就 下 得 
像 模 像样 了 。 一 天 半 后 ， 也 就 是 相当 于 下 了 2 600 万 盘 棋 后 就 超过 了 战 
胜 李 世 石 的 AlphaGo Lee。3 天 后 ，AlphaGo Zero 就 和 AlphaGo Lee 打 了 
个 100: 0。AlphaGo Lee 一 共 学 了 3 000 万 个 中 盘 ， 大 致 相当 于 3 000 
万 /400=8 万 盘 棋 ， 这 时 AlphaGo Zero 已 经 相当 于 下 了 5 100 万 盘 棋 。21 
天 后 就 打败 了 横扫 天 下 无 敌手 的 AlphaGoMaster， 到 40 天 后 哥 俩 已 经 妥 
受 地 称霸 天 下 ， 独 孤 求 败 。 到 这 里 ，AlphaGo 团 队 终 于 松 了 口气 ， 放 
下 了 原先 的 一 个 最 大 担忧 : 如果 不 让 人 类 引进 门 ， 从 零 学 起 ， 这 哥 俩 
会 不 会 在 野地 里 瞎 性 ， 在 林子 里 迷路 ， 像 梦游 一 样 原 地 绕 大 圈 ， 永 远 
都 走 不 出 来 。 这 证 明了 在 强化 学 习 中 只 要 每 一 步 都 知道 对 错 ， 有 惩罚 
次 励 ， 哥 俩 很 快 束 会 放弃 那些 明显 不 通 的 绝 大 部 分 的 道路 ， 很 快 就 会 
找到 一 条 正路 。AlphaGo 用 了 1 200 个 CPU，176 个 GPU， 而 AlphaGo 
Zero 只 用 了 4 个 TPU ( 张 量 处 理 单元 。 计 算 资 源 的 大 幅度 下 降 主要 来 
自 算法 的 精简 ， 不 需要 用 人 类 数据 训练 了 。 由 此 可 见 ， 在 不 同 的 应 用 
场景 下 ， 数 据 并 非 都 那么 重要 。 在 下 围棋 这 件 事 上 ， 人 类 的 经 验 反 而 
拖 了 后 腿 。AlphaGo Zero 给 我 们 最 重要 的 启示 是 柯 洗 说 的 那 句 话 , “人 


类 下 了 2 000 年 围棋 ， 连 边 儿 都 没 措 厦 ”。 非 第 原始 的 机 器 在 目 己 措 索 
了 36 个 小 时 后 ， 就 超过 了 全 人 类 2 000 年 来 摸索 积累 的 全 部 围棋 知识 。 


现在 请 大 家 思考 三 个 问题 : 

为 什么 AlphaGo Zero 从 零 学 起 反而 比 人 强 ? 

AlphaGo Zero 再 从 头 学 一 裔 ， 功 力 还 和 原来 一 样 吗 ? 
AlphaGo Zero 是 不 可 战胜 的 吗 ? 


神经 网 络 迟 论 


读者 到 这 里 会 发 现 一 个 悖 论 : 神经 网 络 是 模仿 人 脑 ， 怎 么 能 够 发 
现 和 掌握 人 脑 无 法 掌握 的 知识 ? 我们 知道 目前 的 半导体 芯片 中 的 人 工 
神经 网 络 只 是 对 大 脑 的 一 个 简单 模仿 ， 无 论 是 在 神经 元 数量 还 是 在 连 
接 的 复杂 性 上 都 远 不 如 人 脑 。 到 发 是 什么 原因 使 得 人 工 神经 网 络 能 够 
在 发 现 隐蔽 的 相关 性 方面 远 超人 脑 ， 创 造 出 如 此 多 的 神 迹 呢 ? 


第 一 个 原因 是 人 的 感官 和 机 器 的 “感官 "? 相 比 实在 太 差 。 人 的 感官 
在 几 亿 年 的 进化 中 主要 是 为 了 在 目 然 界 中 更 食 和 求偶 。 所 以 只 能 感受 
到 部 分 外 部 世界 信息 。 比 如 眼睛 只 能 看 到 光谱 中 的 可 见 光 这 一 小 段 ， 
无 法 “看 见 ” 从 无 线 电 波 到 受 米 波 再 到 远 红 外 的 电磁 波 ， 也 无 法 “看 
见 ” 从 紫外 线 到 X 射 线 再 到 伽 马 射线 。 人 的 耳 东 也 听 不 到 20 赫 效 以 下 的 
亚 声波 和 20 000 赫 兹 以 上 的 超声 波 。 不 仅 如 此 ， 人 类 的 视觉 和 听觉 对 
强度 的 分 辨 率 非常 粗糙 ， 只 能 分 出 数量 级 。 人 类 的 触觉 、 嗅 觉 、 味 觉 
分 辨 率 更 是 粗糙 。 而 机 大 的 “感官 ”， 束 是 各 类 物理 、 化 学 、 生 物 类 的 
传 感 絮 则 比 人 的 感官 精密 得 多 。 不 仪 可 以 “感受 "到 人 类 感受 不 到 的 信 
思 ， 对 信息 的 分 辨 率 也 远 超人 类 。 如 采 有 办 法 把 这 些 传 感 詹 信号 不 经 
过 人 类 感官 直接 输入 大 脑 ， 人 类 大 脑 也 能 和 机 大 一 样 发 现 数 据 间 复杂 
隐 巩 的 相关 性 吗 ? 大 脑 能 处 理 高 分 辨 率 的 外 界 信息 吗 ? 我 们 可 以 合理 


地 推测 出 大 脑 的 进化 应 该 和 感官 相 匹配 。 如 采 感 官 只 能 提供 低 分 辩 率 
信息 ， 大 脑 处 理 高 分 辨 率 信 息 的 能 力 束 是 一 种 混 费 ， 这 种 功能 要 么 不 
可 能 演化 出 来 ， 要 么 即使 偶然 变异 出 来 也 会 被 进化 无 情 地 消 炙 。 

第 二 个 原因 征 电 子 神经 元 比 生 物 神 经 元 的 传输 信号 速度 快 ， 准 确 
度 高 。 由 于 人 脑 神经 元 在 突 触 部 分 的 信号 是 通过 化 学 分 子 传导 的 〈 细 
胞 膜 内 外 带电 的 离子 浓度 差 造成 电压 差 )  ， 每 秒 钟 大 约 只 能 传导 400 次 
信和 号。 而 电子 神经 元 间 的 传输 速度 就 是 心 片 上 不 同 唱 体 管 之 则 的 传输 
速度 ， 比 人 脑 神经 元 要 快 儿 万 倍 。 人 脑 神经 元 突 触 之 间 的 传输 非常 不 
可 靠 ， 平 均 每 次 传输 的 成 功率 只 有 30% (这 种 随机 性 也 许 是 意识 “ 涌 
现 ” 的 重要 条 件 之 一 ) ， 而 电子 神经 元 之 间 的 传输 可 靠 性 几乎 是 
1009%6。 人 脑 神经 元 由 于 结构 复杂 ， 不 同 神经 元 之 间 的 电信 号 会 互相 干 
扰 ， 而 电子 神经 元 之 间 的 干扰 可 以 忽略 不 计 。 所 以 人 脑 神经 元 是 一 个 
慢 腾 腾 的 老 出 错 的 系统 ， 而 电子 神经 元 是 一 个 高 速 的 精密 系统 。 

第 三 个 原因 是 目前 还 没有 办 法 获得 大 脑 内 部 每 一 个 神经 元 的 连接 
强度 。 即 使 我 们 有 办 法 把 外 界 传 感 右 信 与 直接 输入 大 脑 ， 大 脑 也 可 以 
处 理 这 些 信息 ， 这 些 信息 也 只 能 被 雪藏 在 一 个 人 的 脑子 里 ， 成 为 无 法 
沟通 、 无 法 传播 、 无 法 记录 的 默 知识 。 但 电子 神经 网 络 中 的 每 一 个 神 
经 元 之 间 的 连接 强度 ， 也 束 是 两 个 神经 元 连接 的 权重 系数 都 是 可 以 存 
储 、 提 取 的 。 所 以 机 器 获得 的 瞳 知 识 是 可 以 传播 、 复 制 、 记 录 的 。 

所 以 对 这 个 悖 论 的 回答 是 ， 人 工 神经 网 络 虽 然 是 模仿 大 脑 ， 但 它 
具备 了 人 类 没有 的 三 个 优势 : 能 “感受 ”人 类 感受 不 到 的 信息 ， 与 人 脑 
相 比 又 快 又 准 ， 每 一 个 神经 元 的 状态 都 是 可 测量 的 。 


神经 网 络 五 大 研究 前 沿 


之 前 介绍 的 几 种 神经 网 络 都 是 目前 商用 中 的 主流 算法 ， 但 机 融 学 
习 的 洪 力 还 远 没 有 被 挖 尽 ， 现 在 每 年 关于 机 融 学 习 的 论文 还 在 三 指数 


级 增长 ， 在 人 研究 型 的 大 学 里 任何 关于 机 器 学 习 的 课程 部 爆满 。 可 以 预 
期 在 今后 3~5 年 中 还 会 不 断 有 新 的 算法 突破 ， 下 面 介绍 的 都 是 目前 久 手 
可 热 的 研究 方向 ， 每 一 个 方 同 的 突破 都 会 产生 巨大 的 商业 价值 。 


非 监督 学 习 


在 前 述 的 机 器 学 习 算 法 中 ， 我 们 总 有 一 个 训练 数据 集合 ， 即 “标注 
数据 ”， 如 所 有 汽车 图 片 都 会 标注 上 “汽车 ”>， 所 有 猫 的 图 片 都 会 标注 
上 “ 猫 * 等 。 这 样 在 训练 的 输出 端 ， 我 们 就 知道 结果 古 否 正确 ， 因 此 可 
以 用 正确 结果 和 输出 结果 的 差 来 训练 机 器 (调整 各 层 的 权重 系数 ) ， 
忠 像 一 个 妈妈 教 孩 子 认 识 东西 ， 这 类 算法 叫 “ 监 督学 习 ”。 在 机 姨 学 习 
中 还 有 一 种 算法 不 依赖 于 “标注 数据 "， 叫 “ 非 监 督学 习 ”， 像 一 个 孩子 
在 没 人 教 的 情况 下 目 己 学 习 。 非 监督 学 习 最 常用 的 情形 十 分 类 ， 例 如 
一 个 孩子 见 过 许多 猫 和 狗 后 ， 如 采 大 人 不 告诉 孩子 这 两 种 动物 的 名 
字 ， 孩 子 也 许 不 知道 名 字 ， 但 慢 慢 会 知道 猫 和 狗 是 两 种 不 同 的 动物 。 
在 商业 上 有 很 多 应 用 ， 例 如 在 营销 上 面 可 以 根据 人 群 的 不 同属 性 将 其 
划分 成 不 同人 群 进行 精准 膏 销 ， 在 社交 媒体 上 面 ， 可 以 根据 人 们 之 间 
的 互动 次 数 ， 划 出 每 个 人 的 朋友 圈子 ， 在 医疗 诊断 上 面 可 以 根据 不 同 
证 状 之 间 的 相关 性 更 精确 地 预测 还 未 发 现 的 疾病 ; 等 等 。 


增 量 学 习 和 连续 学 习 


目前 的 机 器 学 习 算 法 都 是 “离线 训练 "， 先 用 一 大 堆 数 据 训 练 模 
型 ， 训 练 完 测试 好 融 拿 去 做 识别 用 ， 在 识别 过 程 中 ， 这 个 模型 是 固定 
的 。 如 采 发 现 了 新 的 情况 ， 有 了 新 的 训练 数据 ， 束 要 把 新 数据 和 原来 
的 老 数据 合 在 一 起 重新 训练 这 个 模型 ， 训 练 完 还 要 重新 测试 才能 使 
用 。 许 多 互联 网 巨头 每 个 月 都 要 训练 几 十 万 个 模型 ， 目 前 的 计算 量 主 


要 在 训练 上 。 增 量 学 习 束 是 当 有 痢 数 据 时 ， 只 用 者 数据 训练 原来 的 模 
型 ， 使 机 巍 在 原 有 的 识别 功能 之 上 增加 新 的 识别 功能 。 连 续 学 习 就 是 
能 够 边 识别 边 学 习 。 这 两 种 学 习 算 法 都 还 在 研究 的 早期 阶段 。 


生成 对 抗 网 络 


监督 学 习 的 最 大 问题 之 一 就 是 需要 大 量 人 工 标 注 的 数据 。 在 很 多 

情况 下 ， 要 么 没有 数据 ， 要 么 标注 的 工作 量 太 大 。 生 成 对 抗 网 络 

(Generative Adversarial Network，GAN) 解决 了 这 个 问题 。 因 此 GAN 
成 为 目前 最 炙手可热 的 非 监督 学 习 算法 之 一 。 


GAN 城 少 深度 学 习 训 练 所 需 的 数据 量 的 方法 是 : 从 少量 的 已 有 数 
据 出 发 去 创造 出 更 多 的 新 的 标注 数据 一 一 多 数 情况 下 是 图 像 数 据 。 


图 3.13 是 GAN 的 示意 图 ， 图 中 有 两 个 深度 神经 网 络 : G 和 D， 其 中 
G 是 生成 网 络 ，D 是 鉴别 网 络 。 生 成 网 络 的 任务 是 根据 一 组 真实 、 有 限 
的 数据 〈 例 如 一 组 图 片 ) 生成 更 多 类 似 但 不 同 的 数据 。 然 后 把 这 些 生 
成 的 数据 和 真实 数据 混在 一 起 喂 给 鉴别 网 络 。 鉴 别 网 络 的 任务 是 使 用 
很 少 的 真实 数据 训练 后 ， 分 出 哪些 是 真实 数据 哪些 是 生成 数据 。 如 果 
生成 网 络 生成 的 数据 能 被 鉴别 网 络 认 出 来 不 是 真实 数据 ， 就 说 明生 成 
网 络 模仿 得 不 够 真实 ， 需 要 继续 调整 网 络 参 数 ， 目 的 是 让 鉴别 网 络 分 
不 出 来 。 如 果 鉴 别 网 络 分 不 出 来 真 假 ， 就 说 明 鉴 别 网 络 不 够 好 ， 需 要 
继续 调整 参数 分 出 真 伪 。 这 样 “ 道 高 一 尺 ， 魔 高 一 丈 ” 地 持续 对 抗 下 
去 ， 两 个 网 络 就 越 来 越 好 : 生成 网 络 模仿 得 越 来 越 真 ， 鉴 别 网 络 越 来 
越 “ 火 有 眼 金 睛 。 当 两 个 网 络 打 得 难 解 难 分 时 ， 生 成 网 络 生成 出 来 的 数 
据 就 和 真实 数据 无 法 分 辩 。 当 缺乏 足够 多 的 真实 数据 时 这 些 生 成 数据 
就 可 以 用 于 神经 网 络 的 训练 了 。 
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图 3.13 生 成 对 抗 网 络 


可 以 把 这 个 过 程 想 象 为 一 个 警察 和 假币 伪造 者 之 间 的 比拼 ， 伪 造 
者 想 把 假币 做 得 像 真 的 ， 警 察 希 望 看 到 任何 钞票 时 都 能 鉴别 出 真 伪 。 
两 个 对 抗 网 络 也 在 彼此 学 习 ， 也 了 避 是 说 ， 当 一 个 网 络 努力 去 鉴别 假币 
时 ， 另 一 个 网 络 束 能 把 假币 做 得 越 来 越 真 。 


另 一 个 例子 是 生成 对 抗 网 络 可 以 模仿 名 画 。 经 过 训练 之 后 的 最 终 
结果 是 ， 一 个 网 络 可 以 像 凡 : 高 、 毕 加 索 一 样 作 画 ， 另 一 个 网 络 能 以 你 
闻所未闻 的 洞察 力 鉴 别 画 作 。 这 对 于 医疗 等 领域 来 说 非常 重要 ， 在 这 
些 领域 中 ， 由 于 隐私 的 需要 ， 可 用 的 数据 非常 有 限 。GAN 可 以 填补 缺 
失 的 数据 ， 目 行 制作 完全 “ 腾 造 ”的 病 患 数据 ， 而 这 些 数 据 在 用 于 训练 
AI 时 和 真实 数据 同样 有 效 。 深度 生成 模型 有 广泛 的 应 用 ， 包 括 密度 舍 
计 、 图 像 降 品 〈 从 低 分 辨 率 或 高 噪音 的 图 像 中 生成 高 品质 图 像 ) 、 
像 修复 (从 部 分 残缺 的 图 像 中 恢复 完整 图 像 ，、 数 据 压缩 、 场 景 理 
解 、 表 征 学 习 、3D 场 景 搭建 、 半 监督 分 类 或 分 级 控制 等 。 


相 比 判别 模型 (例如 CNN) ， 生 成 模型 更 厉害 的 原因 如 下 : 


(1) 能 够 从 数据 中 识别 并 表现 出 隐藏 的 结构 ， 例 如 三 维 物体 的 旋 
转 、 交 强 、 有 亮度 或 形状 等 概念 。 


(2) 能 够 想象 世界 * 可 以 是 什么 样 *， 而 不 是 仅仅 展现 世界 “已 经 
是 什么 样 " 。 


(3) 通过 拟 合并 生成 近似 真实 的 场景 ， 可 以 预见 未 来 。 


迁移 学 习 


迁移 学 习 的 一 个 例子 是 当 一 个 神经 网 络 学 会 了 中 文 翻译 成 日 文 ， 
再 让 它 学 德 文 翻译 成 美文 时 就 比 从 头 训练 要 花 的 时 间 少 得 多 。 这 里 面 
的 道理 在 于 语言 的 结构 有 很 多 相似 的 地 方 ， 一 旦 掌握 了 这 些 结构 ， 学 
习 下 一 个 就 快 了 。 这 和 人 的 技能 学 习 类 似 。 可 以 想象 ， 只 要 两 种 任务 
的 结构 有 相似 之 处 ， 束 可 以 用 迁移 学 习 的 方法 。 


学 习 如 何 学 习 


学 习 如 何 学 习 也 叫 “ 元 学 习 ”。 目 前 所 有 的 神经 网 络 都 是 为 了 一 个 
单一 任务 而 被 设计 和 训练 的 。 换 一 个 不 同 的 任务 ， 例 如 从 识别 图 片 换 
成 学 下 棋 ， 原 来 的 机 器 束 完 全 不 工作 了 。 目 前 的 所 谓 “ 元 学 习 ” 并 非 让 
机 妖 和 人 一 样 掌握 举 一 反 三 的 能 力 ， 而 是 让 同一 个 机 器 适应 更 多 种 类 
的 工作 。 一 个 办 法 是 训练 时 用 多 个 种 类 的 任务 来 训练 。 男 一 个 办 法 是 
把 机 器 分 为 两 个 层次 :学习 任 务 的 机 器 和 观察 学 习 过 程 的 机 器 。 如 果 
后 者 能 够 领悟 出 不 同 任务 之 间 的 相关 性 ， 束 可 以 更 快 地 学 习 新 任务 。 

神经 网 络 可 以 有 许多 不 同 的 结构 ， 例 如 不 同 的 层 数 、 不 同 的 连接 
方式 ， 等 等 。 把 这 些 结构 看 成 一 个 可 能 的 空间 ， 让 机 器 目 己 在 这 个 空 
间 中 寻找 对 给 定 问题 的 最 佳 结构 。 


深度 学 习 的 局 限 性 


上 面 介 绍 了 一 些 目 前 最 热 的 神经 网 络 ， 例 如 卷 积 神经 网 络 、 循 环 
神经 网 络 、 强 化 学 习 、 生 成 对 抗 网 络 等 ， 它 们 有 很 多 神奇 的 地 方 ， 在 
实际 中 也 得 到 了 相当 广泛 的 应 用 。 但 神经 网 络 也 好 ， 深 度 学 习 也 好 ， 
都 不 是 万 能 的 ， 它 们 有 其 目 身 的 局 限 性 。 


神经 网 络 的 一 个 局 限 性 是 ， 需 要 依赖 特定 领域 的 先 验 知识 ， 也 就 
是 需要 特定 场景 下 的 训练 ， 说 白 了 就 是 神经 网 络 只 会 教 什么 学 什么 ， 
不 会 举一反三 。 神 经 网 络 的 这 个 局 限 性 ， 是 因为 神经 网 络 的 学 习 本 质 
上 就 是 对 相关 性 的 记忆 ， 也 就 是 说 神经 网 络 将 训练 数据 中 相关 性 最 高 
的 因素 作为 判断 标准 。 打 比方 说 ， 如 果 一 直 用 各 个 品种 的 白色 狗 来 训 
练 神经 网 络 ， 让 它 学 会 “这 是 狗 ” 的 判断 ， 神 经 网 络 会 发 现 这 些 狗 最 大 
的 相关 性 就 是 白色 ， 从 而 得 出 结论 ， 白 色 = 狗 。 在 这 种 情况 下 ， 让 这 
个 神经 网 络 看 见 一 只 白 猫 ， 甚 至 一 只 白 兔 子 ， 它 仍然 会 判断 为 狗 。 机 
器 学 习 的 这 种 呆板 行为 ， 用 专业 术语 描述 叫 “过 度 拟 合 *。 如 果 想 让 神 
经 网 络 变 得 更 聪明 ， 就 必须 用 各 种 颜色 、 各 个 品种 、 是 否 穿 衣服 等 各 
种 场景 下 的 狗 来 训练 神经 网 络 ， 如 此 它 才 有 可 能 发 现 不 同 的 狗 之 间 更 
多 的 相关 性 ， 从 而 识别 出 更 多 的 狗 。 人 类 则 不 同 ， 一 个 两 三 岁 智力 发 
育 正常 的 孩子 ， 在 看 过 几 只 狗 之 后 ， 就 能 认 出 这 世上 几乎 所 有 的 狗 
了 。 无 筑 大 量 标注 数据 和 特殊 场景 的 训练 ， 只 需要 少量 的 数据 ， 人 脑 
就 可 以 自己 想 清楚 这 个 过 程 。 在 这 方面 ， 目 前 的 神经 网 络 和 人 脑 相 
比 ， 还 有 很 大 的 差距 。 

再 如 前 面 提 到 的 汽车 和 猫 的 例子 ， 如 果 一 直 用 正常 的 汽车 来 训练 
这 个 神经 网 络 ， 那 么 当 神经 网 络 突然 看 到 图 3.14 的 时 候 ， 很 有 可 能 
法 把 它 认 作 汽车 ， 而 觉得 它 更 像 猎 。 

这 个 问题 在 自动 驾驶 领域 显得 尤为 突出 ， 由 于 道路 交通 状况 的 复 
杂 性 ， 各 种 交通 指示 标志 的 多 样 性 ， 想 把 所 有 的 道路 交通 场景 都 训练 


到 显然 征 不 可 能 的 。2016 年 特 斯 拉 第 一 起 目 动 芝 驶 致死 的 事故 也 和 这 
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个 原因 有 关 。 


图 3.14 机 器 学 习 会 把 这 辆 汽车 当成 猎 


神经 网 络 的 另 一 个 局 限 性 是 无 法 解释 结果 为 什么 是 这 样 ， 因 为 人 
类 无 法 理解 瞳 知 识 ， 所 以 更 无 法 解释 。 对 于 神经 网 络 这 个 “ 满 是 旋钮 的 
黑 盒 子 ”， 每 个 旋钮 为 什么 旋转 到 那个 位 置 ， 而 不 是 多 一 点 或 者 少 一 
上 护 ， 都 古 无 法 解释 的 。 这 个 不 可 解释 性 在 许多 涉及 安全 和 公共 政策 的 
领域 都 是 很 大 的 问题 。 例 如 ， 医 疗 涉及 人 的 健康 和 生命 ， 医 生 的 诊断 
需要 根据 极为 严谨 的 医学 逻辑 ， 因 此 医疗 对 于 人 工 知 能 的 可 解释 性 要 


求 远 高 于 其 他 行业 ， 极 少 有 医院 或 医生 敢 把 无 法 解释 的 诊断 结 末 用 在 
患者 号 上 。 然 而 由 于 神经 网 络 目 身 不 具备 医学 逻辑 ， 其 输出 的 结 打 也 
缺乏 医学 上 的 解释 性 ， 因 此 目前 人 工 智能 在 医学 上 的 应 用 ， 无 论 是 影 
像 识 别 还 是 辅助 诊断 ， 都 需要 专业 医生 的 复核 ， 距 离 取 代 医 生还 有 较 
大 的 距离 。 


人 工 知 能 之 所 以 有 上 述 两 个 局 限 性 ， 主 要 是 因为 目前 的 神经 网 络 
只 有 相关 性 的 学 习 能 力 ， 没 有 因 采 推理 能 力 ， 更 无 法 把 一 步 一 步 推理 
的 过 程 表 现 出 来 。 因 此 ， 想 要 克服 这 两 个 局 限 性 ， 我 们 需要 有 因 末 推 
理 能 力 的 人 工 智 能 。 权 实现 这 件 事 情 ， 人 工 智能 需要 做 的 ， 不 仅 是 识 
别 场景 ， 还 需要 将 识别 出 来 的 场景 和 它 具 体 的 功能 以 及 想 做 的 事情 结 
合 起 来 ， 从 而 实现 合理 的 逻辑 推理 。 


让 我 们 看 看 人 脑 古 如 何 理 解 一 个 场景 的 。 当 人 进入 一 个 新 的 房间 
时 ， 会 很 目 然 地 对 这 个 房间 的 大 小 ， 里 面 各 个 物品 的 大 小 、 位 置 等 有 
一 个 大 致 的 认识 。 之 后 ， 人 脑 会 把 识别 出 的 场景 和 物品 ， 与 其 功能 一 
一 匹配 ， 例 如 ， 床 是 用 来 丹 的 ， 而 且 是 一 张 双人 床 可 以 喘 两 个 人 ， 椅 
子 征 用 来 坐 的 ， 杯 子 是 用 来 喝 水 的 ， 等 等 。 然 而 值得 注意 的 是 ， 上 述 
的 几何 重建 和 功能 推理 ， 其 精度 是 和 具体 任务 相 结合 的 。 例 如 ， 人 一 
开始 看 到 杯子 ， 会 匹配 它 喝 水 的 功能 ， 并 看 到 它 放 在 果子 上 ， 判 断 距 
离 目 己 两 三 米 远 ， 这 个 距离 判断 是 非常 不 精确 的 。 然 而 当 人 真 的 需要 
喝 水 时 ， 喝 水 成 为 一 个 任务 ， 人 在 走 过 去 拿 杯子 的 过 程 中 ， 不 断 地 、 
更 加 精确 地 判断 目 己 和 杯子 的 距离 ， 直 到 非常 精确 地 拿 到 杯子 。 这 个 
过 程 束 是 一 个 典型 的 任务 驱动 的 场景 识别 和 功能 推理 。 


此 外 ， 人 类 对 于 功能 的 推理 ， 并 非 会 拘泥 于 具体 的 物体 ， 而 是 能 
抽象 出 这 个 物体 和 功能 有 关 的 物理 特性 ， 从 而 匹配 其 功能 。 仍 然 以 喝 
水 为 例 ， 如 采 房 间 里 没有 杯子 ， 但 是 有 一 个 于、 一 个 盘子 、 一 根据 面 
杖 ， 人 会 很 自然 地 选择 靳 作为 唱 水 的 工具 《如果 连 球 都 没有 则 可 能 选 
择 盘 子 ) ， 因 为 飘 可 以 作为 容 髓 的 物理 特点 和 杯子 是 一 致 的 。 而 且 ， 
选择 了 味 之 后 ， 人 合 款 的 动作 ， 喝 水 的 动作 ， 都 会 和 拿 杯子 不 一 样 ， 


这 同样 是 由 杯子 和 对 不 同 的 物理 特性 决定 的 。 由 此 可 见 ， 人 对 于 物体 
的 功能 推理 ， 是 会 根据 任务 的 要 求 ， 抽 象 其 物理 特性 ， 从 而 推理 它 的 
功能 并 完成 任务 ， 因 此 人 工 智能 的 场景 识别 和 功能 匹配 ， 是 需要 基于 
场景 和 物体 的 物理 特性 来 完成 的 ， 而 不 仅仅 是 识别 和 标定 具体 功能 。 


这 种 基于 任务 驱动 的 因果 推理 和 当前 的 神经 网 络 的 对 比如 下 。 
( 见 表 3.1) 


表 3.1 神 经 网 络 和 任务 驱动 的 对 比 


神经 网 络 任务 驱动 
物体 识别 识别 物体 是 什么 识别 物体 的 物理 特性 
识 
如 果 没 训练 过 ， 就 无 法 识别 即使 没 训 练 过 ， 也 可 以 识别 


| 果 没 训 | 疆 工 J 9 Ey 天 法 J 本 0 有 ] 使 没 训 练 ; 十 ， 出 能 匹 本 和 


数据 标定 驱动 


需要 大 量 数据 训练 


有 推理 能 


资料 来 源 ， 朱 松 纯 ，《 正 本 清 源 》，2016 年 11 月 刊登 于 《视觉 求索 》。 

目前 在 这 个 方面 探索 的 代表 人 物 是 加 州 大 学 洛杉矶 校区 
(UCLA) 的 图 灵 奖 获得 者 朱 迪 亚 . 珀 尔 (Judea Pearl) 教授 以 及 他 的 同 
事 朱 松 纯 教授 。 他 们 认为 可 以 建立 一 个 基于 常识 之 上 的 “概率 决策 
图 ”"， 也 叫 “ 概 率 语 法 图 ”*”。 这 个 模型 把 人 类 的 常识 和 世界 模型 都 包含 进 
来 ， 又 采用 贝 叶 斯 原理 ， 可 以 像 人 类 一 样 不 需要 许多 数据 吏 能 学 会 ， 
在 处 理 许多 问题 上 效率 远 高 于 神经 网 络 。 在 高 科技 领域 ， 人 硅谷 一 家 由 
斯 坦 福 大 学 教授 威 德 罗 的 第 子 创办 的 人 工 六 能 公司 Vicarious 得 到 了 著 
名 风险 投资 人 蒂 尔 (Peter Thiel) 、 特 斯 拉 创 始 人 马 斯 元 、 脸 书 创始 人 


扎 克 伯 格 (Mark Zuckberg) 和 亚马逊 创始 人 贝 佐 斯 (Jeff Bezos) 的 投 
资 。 他 们 也 是 采用 了 概率 决策 图 的 方法 。 虽 然 目 前 他 们 是 少数 派 ， 但 
也 许 若干 年 后 会 异军突起 ， 就 像 神经 网 络 坐 了 50 年 “ 冷 板 有 使" 今天 突然 
一 飞 冲 天 一 样 。 


第 四 章 
逐鹿 人 硅谷 一 一 AI 产 业 争 圭 战 


这 一 章 不 谈 理论 和 技术 ， 只 谈 AI 的 产业 生态 。 对 于 想 抓 住 AI 
时 代 投 资 机 会 的 人 ， 这 章 提 供 了 对 AI 产业 和 商业 的 一 个 基础 理 
解 。 没 有 读 过 前 面 章 节 的 读者 也 可 以 直接 读 这 一 章 。 


最 新 技术 巨 当 


人 工 智能 坚 无 疑问 是 继 移动 互联 网 之 后 的 一 次 超级 大 沁 ， 其 规模 
和 影响 至 少 是 互联 网 级 别 的 。 这 次 创新 大 浪 启 动 的 标志 性 事件 是 2012 
年 的 ImageNet 比 赛 。ImageNet 目 前 有 1 400 万 张 图 片 ， 其 中 上 百 万 张 有 
文字 标注 。 标 注 的 文字 通常 是 用 短语 描述 该 图 片 的 内 容 (例如 “草地 上 
卧 着 的 一 条 黄 狗 >) 。ImageNet 的 比赛 主要 是 看 谁 的 程序 能 够 最 准确 地 
识别 出 图 片 的 内 容 。 在 2012 年 以 前 ， 识 别 主要 是 人 工 选 择 物体 特征 并 
且 写 出 识别 这 些 特 征 的 程序 ， 谁 确 率 的 最 高 水 平一 直 在 74% 左 右 徘 
徊 。2012 年 ， 亚 历 克 斯 :区 里 捷 夫 斯 基 使 用 多 层 神 经 网 络 AlexNet 一 举 
把 识别 率 提高 了 10 个 百分点 ， 达 到 84%。 


个 突破 性 结果 立即 引起 了 产业 界 的 强烈 兴趣 和 关注 。 合 歌 大 脑 
ee 迪 恩 (Jeff Dean) 敏锐 地 发 现 了 这 个 重大 机 遇 ， 他 用 了 
一 年 的 时 间 说 服 了 谷歌 当时 的 CEO (首席 执行 官 ) 兼 创始 人 拉 里 . 佩 奇 

(Larry Page) ， 开 始 全 公司 大 举 转 型 AI[， 随 后 Facebook、 微 软 、 百 度 
等 科技 巨头 纷纷 跟 进 。 如 图 4.1 所 示 ， 在 今后 几 年 ， 神经 网 络 不 断 提高 

识别 的 准确 率 ， 终 于 在 2015 年 达到 96% 的 准确 率 ， 超 过 了 人 类 所 能 达 
到 的 95%。 这 些 突破 证 明了 机 妖 学 习 可 以 开始 解决 实际 问题 ， 也 让 工 
业 办 认识 到 了 巨大 的 商业 潜力 。 但 这 个 突破 来 之 不 易 ，AI 走 过 了 60 年 
的 艰 邓 道路 。 
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图 4.1 2010 一 2015 年 ImageNet 大 赛 历年 识别 准确 率 


图 片 来 源 : http://yann.lecun.com/。 


AI 突 破 三 要 素 


AI 发 展 了 60 年 ， 为 什么 到 今天 能 够 突破 ? 这 是 由 于 长 期 积累 的 三 
个 条 件 成 熟 了 。 

第 一 个 条 件 是 计算 能 力 。 计 算 能 力 和 半导体 的 集成 度 (在 单位 半 
导体 材料 面积 上 可 以 集成 的 晶体 管 的 数量 ) 直接 相关 。 从 第 一 个 集成 
电路 晶体 管 诞生 以 来 ， 在 过 去 的 50 年 中 ， 半 导体 的 集成 度 的 增加 速度 
基本 遵循 “摩尔 定律 ”。1965 年 4 月 19 日 ，《 电 子 学 》 杂 志 

(Electronics) 发 表 了 仙 童 半导体 公司 工程 师 戈 登 . 摩 尔 (Gordon 
Moore， 后 成 为 英特尔 的 创始 人 之 一 ) 押 写 的 文章 《让 集成 电路 填 满 
更 多 的 组 件 》， 文 中 预言 半导体 芯片 上 集成 的 晶体 管 和 电阻 数量 将 每 
年 增加 一 倍 。1975 年 ， 摩 尔 在 IEEE ( 电 竞 和 电子 工程 师 协 会 ) 国际 电 
子 组 件 大 会 上 提交 了 一 篇 论文 ， 根 据 当 时 的 实际 情况 对 摩尔 定律 进行 
了 修正 ， 把 “每 年 增加 一 倍 ? 改 为 “每 两 年 增加 一 倍 ?”， 而 这 个 定律 经 过 
传播 演化 ， 变 成 今天 普遍 流行 的 说 法 “计算 机 运算 速度 每 18 个 月 提升 一 
倍 ， 价 格 每 18 个 月 下 降 一 半 ”。1970 年 一 个 芯片 上 的 晶体 管 数量 约 为 1 
000 个 ， 今 天 一 个 芯片 上 的 晶体 管 数 量 达到 100 亿 个 ， 不 到 50 年 中 提高 
了 1000 万 倍 。 相 应 地 ， 计 算 能 力也 提高 了 1 000 万 倍 。 目 前 虽然 单个 世 
片 的 晶体 管 数 量 增 加 速度 放 缓 ， 但 人们 开始 把 成 百 上 千 个 芯片 封装 在 
一 起 以 便 提 高 总 的 计算 速度 。 


计算 能 力 对 人 工 智 能 的 巨大 推动 还 体现 在 一 个 标志 性 事件 上 
GPU (图 形 处 理 器 ) 被 用 于 训练 AI 算法 。2009 年 ， 斯 坦 福 大 学 计算 机 
系 教授 吴 恩 达 和 他 的 博士 生 拉 加 特 : 监 恩 纳 (Rajat Raina) 第 一 次 提出 
由 于 神经 网 络 中 大 量 计算 可 以 并 行 ， 用 一 个 GPU 可 以 比 双核 CPU 快 70 
倍 ， 原 来 需要 几 周 完成 的 计算 一 天 就 可 以 完成 。 之 后 纽约 大 学 、 多 伦 
多 大 学 及 瑞士 人 工 智能 实验 室 纷纷 在 GPU 上 加 速 其 深度 神经 网 络 。 启 
得 2012 年 InageNet 葛 赛 的 AlexNet 同 样 用 的 也 是 GPU“。 从 此 之 后 ，GPU 
就 在 神经 网 络 的 训练 和 识别 中 树立 了 公认 的 王者 地 位 。 再 到 后 来 
AlphaGo 发 威 战 胜 人 类 顶级 围棋 手 ， 背 后 则 是 谷歌 自行 研发 的 专 为 深 
度 学 习 使 用 的 TPU 发 挥 了 重要 文 撑 ， 每 个 TPU 可 以 提供 10 倍 于 GPU 的 
计算 能 力 。 在 本 章 中 将 会 详细 分 析 为 什么 TPU 比 GPU 快 。 


第 二 个 条 件 是 数据 。 如 果 说 算法 是 火箭 发 动机 ， 那 么 数据 就 是 燃 
料 。 由 于 互联 网 的 发 展 和 各 类 传感器 (例如 在 各 种 环境 中 的 温度 、 位 
置 、 压 力 等 物理 化 学 变量 的 测量 ， 社 会 中 大 量 摄像 头 的 存在 ) 成 本 的 
大 幅 下 降 和 广泛 安装 ， 根 据 IDC (互联 网 数据 中 心 ) 的 监测 统计 ， 
2011 年 全 球 数据 总 量 已 经 达到 1.8ZB (1ZB=1 万 亿 GB) ， 相 当 于 18 亿 
个 1TB 的 移动 硬盘 ， 而 这 个 数值 还 在 以 每 两 年 翻 一 番 的 速度 增长 ， 预 
计 到 2020 年 全 球 将 总 共 拥 有 35ZB 的 数据 量 ， 增 长 近 20 倍 。 


这 比 从 人 类 出 现 到 计算 机 出 现 前 产生 的 所 有 数据 都 多 。 以 目前 的 
传感器 技术 发 展 速度 ， 大 干 年 后 回 尖 看 今天 的 数据 量 ， 不 仅 量 小 而 且 
数据 采集 的 密度 和 广度 都 远 远 不 够 。 


第 三 个 条 件 就 是 那 批 甘 愿 坐 “ 冷 板 命 ”的 科学 家 经 过 了 几 十 年 的 积 
累 ， 终 于 从 2006 年 开始 在 算法 上 有 了 重大 突破 。 当 时 在 多 伦 多 大 学 任 
教 的 辛 顿 教授 在 美国 《科学 》 杂 志和 相关 的 期 刊 上 发 表 了 论文 ,证明 
了 深度 神经 网 络 的 能 力 和 实用 性 。 从 此 ， 基 于 多 层 神经 网 络 的 深度 学 
习 理 论 成 为 本 轮 人 工 乔 能 发 展 的 重要 推动 力 ， 相 当 于 过 去 飞机 从 达 : 芬 
奇 设 计 的 扇 翅 膀 的 飞行 器 变 成 有 螺旋 桨 的 发 动机 ， 人 工 智 能 的 概念 和 
应 用 开始 一 路 攀升 ， 语 音 识 别 、 机 器 视觉 技术 在 几 年 间 便 超过 了 人 类 
的 水 平 。 

正 是 算 力 、 数 据 、 算 法 这 三 个 要 素 同 步 成 熟 ， 形 成 合力 ， 终 于 再 
来 了 今天 AI 的 爆发 。 这 三 个 要 素 中 最 重要 的 是 计算 能 力 的 发 展 和 算法 
的 互相 促进 。 


金字 塔 形 的 产业 结构 


一 个 产业 的 生态 主要 是 指 这 个 产业 有 哪些 环节 和 这 些 环节 之 间 的 
关系 ， 例 如 哪个 环 世 是 生态 的 瓶颈 并 掌握 最 强 的 砍 价 能 力 。 更 深入 的 


产业 生态 分 析 还 包括 各 个 环节 的 未 来 发 展 以 及 对 整个 生态 的 影响 。AI 
的 产业 生态 如 图 4.2 所 示 ， 古 一 个 金字 塔 形 的 结构 。 


技术 门槛 高 ， 适 用 
广 ， 学 术 界 为 主 


研发 成 本 高 ， 风 险 
大 ， 克 断 性 强 


和 人 CDS。 Hd 
> 图 像 识别 | 语言 文字 医疗 制 es 
图 4.2AI 产 业 生 态 的 金字 塔 形 结构 
金字 塔 的 下 层 对 上 层 有 依赖 性 ， 但 反之 不 成 立 。 也 就 是 说 上 层 是 


先行 优势 ， 快 速 迭代 ， 

数据 独占 ， 跨 行 合 作 
谁 万 : 行内 ? 行 外 ? 

驱动 力 ， 是 目 变 量 ， 下 层 是 张 动 结果 ， 是 因 变 量 。 人 金字 塔 的 宽度 大 致 

对 应 市 场 规 模 和 公司 的 数量 。 所 以 越 上 层 对 整个 行业 的 影响 越 大 但 市 

场 规模 越 小 ， 越 下 层 市 场 规 模 越 大 但 影响 越 小 。 


产业 的 旺 冠 : 算法 


我 们 前 面 说 过 ，AI 近 年 的 突破 性 发 展 的 三 个 驱动 因素 之 一 是 神经 
网 络 算法 的 突破 。 其 实 这 是 三 个 因素 中 最 重要 的 因素 ， 因 为 其 他 两 个 
因素 (计算 能 力 和 数据 量 ) 属于 “搭便 车 ”。 目 前 研究 算法 主要 集中 在 
美国 的 一 流 大 学 和 几 家 超级 互联 网 公司 〈 谷 歌 、Facebook、 亚 马 运 、 
微软 、IBM、 百 度 等 ) 。 大 学 的 算法 研究 大 部 分 都 是 学 术 性 和 公开 
的 ， 而 大 公司 的 算法 研究 最 核心 的 只 留 给 上 自己 用 。 专 门 研究 算法 的 私 
人 企业 届 指 可 数 ， 一 家 著名 的 算法 公司 就 是 被 合 歌 收购 的 大 胜 围棋 世 
界 冠 军 的 DeepMind。 男 一 家 是 由 人 硅谷 老将 ， 曾 经 做 出 世界 上 第 一 台 掌 
上 电脑 PalmPilot 的 杰 夫 :霍金 斯 (Jeff Hawkins) 创办 的 Numenta (公司 


名 来 自 拉 丁 文 mentis， 意 为 “心灵 ”) 。Numenta 是 一 个 由 私人 资助 的 研 
究 所 ， 他 们 过 去 十 几 年 专注 于 发 展 一 种 叫 作 层级 时 序 记 忆 

(Hierarchical Temporal Memory，HTM) 的 算法 。 这 种 算法 受 大 脑 新 
皮质 中 锥 体 细胞 的 启发， 网 络 结构 远 比 各 种 神经 网 络 复 洒 。 这 种 算法 
的 一 个 特点 是 可 以 连续 学 习 。 神 经 网 络 都 有 一 个 缺陷 ， 在 模型 训练 完 
毕 后 ， 如 果 有 新 数据 可 以 用 ， 或 必须 把 新 数据 和 原来 的 老 数 据 合并 在 
一 起 重新 训练 模型 。 而 HIM 的 连续 学 习 没 有 这 个 缺 隐 ， 当 新 数据 来 了 
以 后 ， 只 要 继续 把 新 数据 喂 给 模型 即 可 。HTM 的 第 二 个 优势 在 于 可 以 
将 物理 世界 的 基本 常识 融入 模型 。Numenta 并 不 寻求 直接 提供 商业 解 
决 方案 ， 而 是 仅仅 提供 算法 的 许可 ， 让 合作 伙伴 用 目 己 的 算法 来 解决 
商业 问题 。Numenta 还 提供 了 开源 的 平台 ， 让 更 多 的 开发 者 在 这 个 平 
台 上 完善 HTIM 算 法 。 从 Numenta 出 来 创业 的 威 德 罗 教授 的 博士 生 迪 利 
普 . 乔 治 (Dileep George) 基于 HTM 创 办 了 一 家 做 机 械 手 通用 软件 的 公 
司 Vicarious。 相 对 于 应 用 ， 纯 粹 做 算法 的 公司 少 得 可 怜 ， 原因 主要 是 
缺乏 商业 模式 。 


技术 制 高 尽 : 芯片 


半导体 必 斤 是 一 切 信 息 技 术 的 基础 ， 有 了 心 片 才 有 电脑 和 存储 ， 

有 了 电脑 和 存储 才 有 互联 网 ， 有 了 互联 网 才 有 大 数据 ， 有 了 大 数据 才 
有 人 工 智能 。 在 这 每 一 波 的 发 展 中 ， 必 请 都 是 最 关键 的 环节 ， 心 片 三 
商 总 是 处 在 霸主 地 位 。 在 大 型 机 时 代 ， 能 够 目 己 开 发 忆 片 的 IBM 独 占 
鳌头 。 在 个 人 电脑 时 代 ， 能 够 生产 出 最 好 的 CPU 的 英特尔 成 为 新 的 霸 
主 。 在 移动 通信 时 代 ， 高 通 (Qualcomm) 几乎 垄断 了 手机 芯片 ， 直 接 
挑战 英特尔 的 霸主 地 位 。 在 云 计算 大 数据 时 代 ， 三 星 (Samsung) 赁 
普 目 己 在 存储 芯片 方面 的 优势 成 为 世界 半导体 第 一 大 厂家 。 在 人 工 管 
能 时 代 ， 谁 将 是 新 的 霸主 ? 


这 个 新 霸主 的 桂冠 很 可 能 落 在 硅谷 的 半导体 公司 英 伟 达 
(Nvidia) 头 上 。 英 伟 达 成 立 于 1993 年 ， 创 始 人 是 出 生 于 中 国 台 湾 ， 
小 时 候 随 父母 来 到 美国 的 斯 坦 福 大 学 毕业 生 黄 仁 勋 (Jen-sen 
Huang) 。 公 司 最 初 是 做 电脑 图 形 显示 卡 ，20 多 年 来 一 直 在 研发 销售 
图 形 显卡 和 图 形 处 理 芯 片 GPU。 除 了 工业 应 用 之 外 ， 图 形 显卡 的 最 大 
市 场 是 电脑 游戏 ， 今 天 高 端 电 脑 游 戏 里 面 几 乎 清一色 用 英 伟 达 的 显 
卡 。 当 电脑 游戏 市 场 开 始 成 熟 后 ， 英 伟 达 也 曾经 想 进 入 手机 市 场 并 收 
购 过 相应 的 公司 ， 但 是 并 不 成 功 。 直 到 2012 年 上 天 为 准备 好 了 的 英 伟 
达 掉 下 一 块 “大 馅 饼 ”， 这 个 馅 饼 就 是 我 们 前 面 提 到 过 的 2012 年 的 
ImageNet 比 赛 。 在 这 个 比赛 中 取得 突破 的 AlexNet 的 发 明 人 亚 历 克 斯 驳 
使 用 了 英 伟 达 的 GPU， 证 明了 GPU 非 常 适合 用 于 有 许多 并 行 计算 的 神 
经 网 络 ， 比 CPU 快 得 多 。 在 这 之 后 的 几 年 ， 其 他 人 都 开始 采用 GPU，， 
比 谁 能 将 网 络 做 得 更 大 ， 层 数 更 多 。 从 此 以 后 ，GPU 成 了 神经 网 络 计 
算 的 引擎， 相当 于 CPU 对 电脑 的 作用 一 样 。 

为 什么 GPU 会 成 为 神经 网 络 计算 的 引擎 ? 训练 神经 网 络 就 相当 于 
调 黑 盒子 上 的 旋钮 ， 调 旋钮 是 通过 数学 的 算法 调 的， 这 些 旋钮 动 辑 几 
十 亿 个 ， 需 要 大 量 的 计算 。 传 统 电脑 用 的 是 CPU， 用 CPU 去 调 旋钮 相 
当 于 调 完 第 一 个 再 调 第 二 个 ， 一 个 一 个 按 顺序 来 ， 昌 然 现 在 CPU 很 
快 ， 但 神经 网 络 的 旋钮 实在 太 多 了 ， 连 CPU 都 招架 不 住 了 ， 这 时 候 
GPU 残 出 现 了 。 

GPU 和 CPU 不 一 样 的 地 方 是 它 一 次 可 以 同时 调 成 千 上 万 个 旋钮 ， 
原来 CPU 几 年 才能 调 完 的 活 GPU 几 天 就 干 完 了 (有 兴趣 的 读者 可 以 看 
附录 3 中 关于 GPU 的 技术 描述 ) 。GPU 的 出 现 ， 让 神经 网 络 可 以 更 大 ， 
因而 处 理 能 力 更 强 ， 从 一 个 纯 学 术 的 研究 项 目 变 为 有 巨大 商业 价值 的 
工具 。 

深度 学 习 需 要 用 GPU 的 主要 有 两 类 : 模型 训练 和 识别 。 前 者 不 光 
要 处 理 大 量 训练 数据 ， 还 要 不 断 地 试验 不 同 的 模型 和 参数 ， 因 此 运算 
量 巨大 ， 一 个 训练 模型 可 能 要 成 百 上 千 个 GPU 来 算 。 识 别 的 计算 量 少 


很 多 ， 但 是 用 户 多 (例如 谷歌 、Facebook 的 用 户 都 以 10 亿 计 ) ， 所 以 
总 的 运算 量 更 大 ， 通 常 是 模型 训练 的 几 十 倍 甚至 上 百倍 。 由 于 几乎 所 
有 的 深度 学 习 都 从 英 伟 达 买 GPU， 所 以 英 伟 达 世 片 一 直 供 不 应 求 ， 其 
股票 从 2015 到 2017 年 涨 了 10 倍 。 


面 对 如 此 大 的 权力 和 利润 ， 其 他 公司 都 心 有 不 甘 。 首 先是 英特尔 
不 甘心 被 摘 下 霸主 桂冠 ， 开 始 在 CPU 里 集成 更 多 的 核心 ，2017 年 的 
Xeon Phi (处 理 器 ) 里 面 多 达 72 个 核 。 但 CPU 毕竟 还 要 做 许多 其 他 事 
情 ， 单 论 深度 学 习 还 是 远 不 如 同 档 次 的 GPU。 先 进 微 器 件 公 司 

(Advanced Micro Device，AMD) 发 扬 一 贯 的 “ 宁 做 老 二 ”的 传统 ， 在 

CPU 上 紧 有 盯 英 特 尔 ， 在 GPU 上 紧 采 英 伟 达 ， 永 远 走 “功能 类 似 ， 价 格 便 
宜 ” 的 路 线 。 

其 他 几 家 互联 网 巨头 也 不 想 眼睁睁 地 看 着 英 伟 达 控 制 着 深度 学 习 
的 命脉 。 谷 歌 就 手 起 袖子 自己 做 了 一 款 自 用 的 TPU。TPU 的 设计 思路 
是 这 样 的 : 既然 GPU 通过 牺牲 通用 性 换取 了 在 图 形 处 理 方面 比 CPU 人 快 
15 倍 的 性 能 ， 为 什么 不 能 进一步 专注 于 只 把 神经 网 络 需 要 的 矩阵 运算 
做 好 ， 进 一 步 提 高 速度 呢 ? 所 以 TPU 设 计 的 第 一 个 诀窍 是 比 GPU 更 专 
注 于 神经 网 络 里 面 计 算 量 最 大 的 矩阵 计算 ， 而 不 需要 像 GPU 一 样 去 顾 
及 图 形 处 理 的 许多 需求 。TPU 的 第 二 个 诀窍 是 采用 低 精 度 的 计算 。 
形 与 图 像 处 理 需 要 很 高 的 精度 (通常 用 32 比 特 浮 点 精度 ) ， 而 用 于 识 
别 的 神经 网 络 的 参数 并 不 需要 很 高 的 精度 。 

所 以 谷歌 的 第 一 款 TPU 就 专门 为 识别 设计 ， 在 运算 上 放弃 32 比 特 
的 浮 点 运算 精度 ， 全 部 采用 8 比特 的 整数 精度 。 由 于 8 比特 的 乘法 器 比 
32 比 特 的 简单 4x4=16 倍 ， 所 以 在 同等 心 片面 积 上 可 以 多 放 许 多 运算 单 
元 。 谷 歌 的 第 一 款 TPU 就 有 65 000 个 乘 加 运算 单元 ， 而 最 快 的 GPU 只 
有 5 300 个 单元 。 有 兴趣 的 读者 可 以 看 附录 3 中 对 于 CPU、GPU 和 TPU 
的 详细 技术 分 析 和 比较 。 


对 于 机 器 学 习 的 必 片 市 场 ， 不 仅 各 大 半导体 三 商 在 攻 城 略 地 ， 美 
` 中 国 、 欧 洲 至 少 有 几 十 家 新 创 公司 也 在 摩 侈 探 党 。 新 创 公司 有 机 


会 吗 ? 


神经 网 络 忆 片 大 致 可 以 分 成 三 大 类 。 第 一 类 是 数据 中 心里 面 使 用 
的 用 于 训练 模型 和 识别 的 芯片 。 目 前 这 类 必 片 几乎 被 英 伟 达 垄 断 。 这 
类 心 片 客户 不 惜 成 本 ， 不 太 计 较 耗 电 ， 只 要 计算 速度 快 。 这 些 必 乒 通 
名 都 用 最 新 的 半导体 工艺 以 便 集 成 最 多 的 晶体 管 。 和 截至 本 书 成 稿 时 ， 
最 先进 的 开始 成 熟 商 用 的 半导体 工艺 是 7 纳米 唱 圆 线 ， 使 用 最 新 的 工艺 
成 本 也 最 高 ， 一 个 芯片 从 研发 、 设 计 、 流 片 、 测 试 到 量 产 的 过 程 耗资 
动 辑 数 十 亿美 元 ， 新 创 公 司 通常 没有 这 么 多 钱 ， 风 险 资 本 也 不 愿意 冒 
这 么 大 风险 。 即 使 能 生产 出 来 ， 销 售 也 是 一 个 极 大 的 问题 ， 要 说 服 大 
客户 们 使 用 一 家 没有 验证 过 的 芒 片 极为 艰难 ， 除 非 新 创 公司 的 芯片 能 
比 现 有 芯片 快 至 少 10 倍 以 上 。 如 果 要 比 现 有 必 片 快 10 倍 以 上 ， 那 么 新 
创 公 司 在 设计 阶段 至 少 要 比 市 场 最 快 必 片 快 100~1 000 倍 ， 因 为 现 有 广 
商 也 不 会 原 地 不 动 ， 也 在 不 断 地 设计 新 一 代 的 忆 片 。 即 使 一 个 新 必 
能 快 10 倍 ， 编 程 软件 环境 包括 编译 器 、 程 序 库 等 完善 也 需要 若干 年 的 
时 间 。 综 上 原因 ， 一 家 新 创 公 司 想 凯 侧 数据 中 心 市 场 风险 非常 大 。 


第 二 类 是 用 于 汽车 目 动 鸭 驶 或 机 絮 人 中 的 已 片 ， 这 类 心 片 的 耗 电 
不 能 太 大 ， 例 如 在 电动 汽车 里 ， 心 片 耗 电 不 能 使 电池 巡航 距离 降低 超 
过 19%6。 对 成 本 有 一 定 的 要 求 ， 计 算 速 度 也 要 比较 快 。 目 前 英 伟 达 的 
GPU 走 各 大 汽车 三 商 的 首选 ， 英 伟 达 也 将 目 动 要 驶 作为 最 重要 的 布局 
领域 。 

AMD、 高 通 、 英 特 尔 都 在 竞争 这 块 市 场 。 高 通 曾经 想 以 440 亿 美 
元 收购 荷兰 半导体 厂商 恩 智 浦 (NXP) 公司 ， 因 为 恩 智 浦 的 芯片 已 经 
广泛 用 在 汽车 的 各 个 控制 系统 里 。2017 年 3 月 ， 英 特 尔 以 153 亿 美元 收 
购 以 色 列 汽车 视觉 公司 Mobileye， 从 而 在 高 级 辅助 芍 驶 系统 (ADAS) 
市 场 实现 领 完 。AMD 联 合 了 原本 是 英 伟 达 合作 伙伴 的 特 斯 拉 开 发 适用 
于 目 动 芝 驶 的 AI 必 片 。 在 巨大 的 市 场 潜力 的 吸引 下 ， 一 些 新 创 公 司 也 
进入 这 个 领域 。 但 整体 而 言 新 创 公司 在 这 个 市 场 的 机 会 也 比较 小 ， 原 


因 类 似 : 研发 成 本 太 高 ， 客 户 (汽车 公司 和 它们 的 一 级 供应 商 ) 大 而 
保守 等 。 


第 三 类 是 用 于 各 类 终端 的 芯片 ， 例 如 用 于 摄像 涉 、 手 机 、 医 疗 设 
备 、 小 型 机 器 人 等 。 这 类 心 片 要 求 耗 电 非 常 低 〈 例 如 手机 ) ,成 本 非 
常 低 ， 在 机 器 学 习 类 的 运算 中 速度 只 要 能 比 CPU 快 10 倍 以 上 即 可 。 新 
创 公司 在 这 一 类 心 片 中 机 会 最 大 。 在 这 类 终端 必 上 中， 以 手机 市 场 最 
大 ， 但 进入 一 流 手机 厂商 的 机 会 也 最 小 。 例 如 苹果 、 三 星 、 华 为 等 一 
流 手机 厂商 几乎 都 用 自己 的 芯片 以 便 提供 差异 化 用 户 体 验 ， 对 它们 来 
说 设计 一 个 神经 网 络 加 速 器 的 难度 并 不 高 。2017 年 苹果 、 华 为 已 将 AI 
元 素 融 入 自家 芯片 ， 发 布 内 置 AI 芯 片 的 iPhone X (苹果 手机 ) 
Mate10 (华为 手机 ) 等 。 另 外 ， 手 机 芯片 三 商 绝 不 会 放弃 这 个 未 来 市 
场 ， 高 通 、 三 星 、 联 发 科 等 计划 在 2018 年 也 推出 融入 人 工 智能 的 芯片 
产品 ， 其 他 手机 广 商 也 会 陆续 使 用 神经 网 络 芯 斤 。 即 使 是 二 三 流 的 手 
机 厂商 也 一 定 要 求 AI 加 速 忆 乒 被 集成 到 CPU 里 而 不 是 增加 一 个 新 的 心 
片 (这 样 几乎 不 增加 成 本 ) 。 新 创 公 司 根本 不 可 能 开发 一 个 全 新 的 带 
AI 加 速 器 的 CPU， 最 多 只 能 把 自己 的 AI 加 速 器 的 设计 给 CPU 芯片 公司 
使 用 ， 但 CPU 芯片 厂商 都 有 自己 设计 AI 加 速 器 的 能 力 ， 所 以 AI 忆 片 的 
新 创 公 司 想 进入 手机 市 场 几乎 没有 可 能 。 


摄像 头 市 场 规模 非常 大 ， 尤 其 是 许多 国家 或 城市 正在 打造 智 营 城 
市 ，AI 必 片 的 需求 潜力 很 难 估量 ， 很 多 AI 必 片 和 算法 创业 公司 都 将 安 
防 作为 最 重要 的 落地 场景 之 一 ， 但 该 领域 的 集中 度 也 很 高 ， 给 安防 设 
备 广 商 提供 视频 处 理 必 片 的 公司 一 定 会 把 AI 功能 集成 进去 ， 安 防 设备 
龙头 乒 家 也 会 研发 目 家 的 AI 必 族 。 所 以 新 创 公 司 的 最 大 机 会 在 于 为 那 
些 还 不 存在 的 或 者 目前 规模 很 小 的 应 用 提供 芒 片 ， 例 如 各 种 小 机 器 
人 、 物 联网 的 应 用 。 投 资 人 要 赌 的 是 这 些 目 前 大 厂 看 不 上 的 市 场 会 在 
扣 短 几 年 内 爆发 。 


许多 读者 会 和 天心， 中 国 的 新 创 公司 在 AI 必 片 上 有 没有 机 会 ? 对 这 
个 问题 的 回答 是 : 上 面 的 分 析 对 任何 一 个 国家 的 独创 公司 都 是 适用 


的 。 


生态 大 战 一 编程 框架 的 使 用 和 选择 


在 AI 领 域 经 常 听 到 一 个 新 技术 名 词 叫 作 “ 编 程 框架 *。 这 个 编程 框 
涤 和 过 去 我 们 熟悉 的 “编程 语言 “操作 系统 ”是 什么 关系? 简单 讲 ， 所 
谓 编 程 框架 就 是 一 个 程序 库 。 这 个 库 里 有 许多 常用 的 函数 或 运算 〈 例 
如 矩阵 乘法 等 。 这 样 的 程序 库 可 以 大 大 市 省 编程 人 员 的 时 间 。 这 些 
编程 框架 的 程序 库 大 多 都 是 “ 面 同 对 象 ” 的 高 级 编程 语言 ， 例 如 C++ 

(计算 机 程序 设计 语言 、Python (一 种 面向 对 象 的 解释 型 计算 机 程 

序 设计 语言 等 。 高 级 编程 语言 易于 编程 但 效率 低 ， 低 级 编程 语言 例 
如 汇编 语言 编程 复杂 但 效率 高 。 用 这 些 高 级 编程 语言 写 的 程序 库 可 以 
在 各 种 不 同 的 操作 系统 上 运行 ， 例 如 Linux (一 种 开源 操作 系统 ) 
Windows (微软 电脑 系统 ) 、Mac OS (苹果 电脑 系统 ) 等 。 

作为 机 器 学 习 的 一 个 早期 现象 ， 现 在 有 许多 种 不 同 的 编程 框架 在 
竞争 。 其 中 比较 著名 的 有 TensorFlow、theano 、Caffe 、MXNet 、 
CNTK torch 等 。 这 些 不 同 的 编程 框架 的 本 质 类 似 ， 通 常 都 由 以 下 五 
部 分 组 成 。 


张 量 对 象 


张 量 就 是 一 组 多 维 的 数据 。 例 如 一 组 24 小 时 每 小 时 平均 温度 的 数 
据 就 是 一 个 有 24 个 数据 的 一 维 张 量 ， 也 叫 向 量 。 一 张 480x640 像 素 的 
黑白 图 像 就 是 一 个 二 维 张 量 ， 也 叫 和 矩阵 。 第 一 个 维度 有 480 个 数据 ， 第 
二 个 维度 有 640 个 数据 ， 共 有 480x640 =307 200 个 数据 ， 每 个 数据 的 值 
就 是 这 张 图 中 一 个 像素 的 灰 度 。 如 果 是 一 张 彩色 图 像 ， 每 个 像素 又 可 


以 分 解 为 红 、 绿 、 蓝 三 原色 ， 这 张 图 像 就 变 成 一 个 三 维 的 张 量 ， 一 共 
有 480x640x3=921 600 个 数据 。 张 量 是 一 种 能 涵盖 各 种 数据 的 形式 ， 不 
论 要 处 理 的 数据 是 天 气 、 有 股票、 人体 生 理 指 标 、 语 音 、 图 像 还 是 视 
频 ， 都 可 以 用 不 同 维度 的 张 量 表示 。 这 样 数据 的 统一 的 表达 使 数学 运 
算 形 式 的 表达 也 能 够 统一 : 都 是 张 量 运算 。 所 以 在 机 器 学 习 计算 时 
(不 论 是 训练 模型 还 是 识别 特征 ) 都 要 先 把 数据 转化 为 张 量 形式 ， 计 
算 结果 出 来 以 后 ， 再 从 张 量 形式 转化 为 原来 的 数据 形式 。 在 所 有 的 张 
量 里 ， 最 常用 的 就 是 二 维 张 量 ， 即 和 矩阵。 下面 为 了 直观 易 仅 ， 我 们 在 
讨论 过 程 中 都 用 矩阵 作为 张 量 的 代表 。 


对 张 量 的 运算 


基于 神经 网 络 的 机 器 学 习 在 本 质 上 古 对 输入 数据 的 一 系列 矩阵 运 
算 、 卷 积 运算 和 非 线性 运算 (例如 只 取 正 值 ， 负 值 一 律 等 于 零 的 运 
算 ) 。 作 为 模型 训练 ， 通 过 反 向 传播 不 断 地 调整 加 权 系 数 ( 即 矩 阵 的 
各 个 元 素 ) 使 最 后 的 输出 与 目标 值 的 差 达 到 最 小 。 作 为 特征 识别 ， 将 
输入 数据 经 过 一 系列 矩阵 和 非 线 性 运算 后 提取 出 某 个 训练 过 的 特征 ， 
然后 再 拿 这 个 特征 和 一 类 已 知 特征 比较 进行 分 类 。 这 些 第 用 的 运算 例 
如 和 矩阵 乘法 、 非 线性 处 理 等 都 可 以 成 为 程序 库 里 的 一 个 运算 或 画 数 。 
当 我 们 调用 这 个 函数 时 ， 只 需要 把 该 填 的 参数 十 进去 ， 例 如 矩阵 的 大 
小 和 内 容 ， 而 不 必 再 目 己 写 矩 阵 的 具体 运算 。 


运算 流程 图 和 程序 优化 


许多 编程 框架 都 提供 可 视 运 算 流程 图 ， 这 个 工具 可 以 把 一 个 神经 
网 络 的 全 部 运算 用 框图 的 方法 画 出 来 ， 框 图 中 的 每 个 市 点 束 是 程序 库 
中 的 一 个 函数 或 运算 (用 编程 语言 说 叫 作 一 个 对 象 ，， 这 样 整个 运算 


非常 直观 ， 也 容易 找到 程序 漏洞 。 当 运算 流程 图 画 出 来 以 后 ， 编 程 框 
架 束 可 以 目 动 把 流程 图 变 成 可 执行 程序 。 对 于 一 个 复 洒 的 程序 ， 用 可 
视 流 程 图 方法 画 出 来 后 有 全 局 观 ， 很 容易 优化 (改动 流程 图 比 改 程序 
容易 ) 。 编 译 器 (把 用 编程 语言 写 的 程序 转化 成 计算 机 底层 指令 的 内 
置 程序 ) 可 以 根据 流程 图 优化 底层 资源 (内 存 、 计 算 等 资源 ) 的 分 
本 


目 动 求 导 髓 


在 神经 网 络 训练 时 最 复杂 的 计算 了 驶 是 把 输出 误差 通过 反 回 传播 ， 
用 最 陡 梯 度 法 来 调整 网 络 各 层 的 加 权 系 数 直 至 输出 误差 最 小 。 这 个 计 
算 基 本 是 一 个 连锁 的 在 网 络 各 层 对 权重 系数 集 求 导数 的 计算 。 在 大 部 
分 的 编程 框架 中 ， 这 个 连锁 求 导 被 打包 成 一 个 运算 函数 (在 Python 程 
序 库 里 是 一 种 “类 ”) 。 在 有 些 提供 高 级 应 用 接口 的 编程 框架 中 ， 例 如 
TensorFlow， 甚 至 把 整个 “训练 ?打包 成 一 个 运算 (“类 ”) 。 在 把 运算 流 
程 图 画 出 来 以 后 (等 于 定义 好 了 神经 网 络 的 大 小 和 结构 ) ， 只 要 调 
用 “训练 * 这 个 运算 开始 运算 训练 数据 ， 束 可 以 得 出 训练 好 的 网 络 参 


数 。 


针对 GPU 的 线性 代数 运算 优化 


传统 的 许多 线性 代数 的 函数 是 在 CPU 上 运算 的 。 前 面 介 绍 GPU 时 
讲 过 ，GPU 的 特点 是 大 量 的 并 行 计算 。 线 性 代数 中 的 运算 许多 都 是 矩 
阵 运 算 ， 而 矩阵 运算 中 有 大 量 可 并 行 的 计算 。 由 于 目前 AI 的 计算 平台 
以 GPU 为 主 ， 所 以 许多 原来 常用 的 线性 代数 画 数 和 运算 包 要 重新 写 ， 
让 这 些 运算 充分 并 行 。 但 这 部 分 工作 不 影响 编程 框架 用 户 的 使 用 方 
式 ， 这 些 优化 后 的 接口 和 使 用 方式 保持 不 变 。 


这 些 编程 框架 都 是 早期 的 机 器 学 习 编 程 者 为 了 自己 方便 使 用 而 积 
累 出 来 的 程序 库 。 它 们 形成 的 时 间 不 同 ， 目 的 相 异 ， 解 决 的 问题 的 侧 
重 面 也 不 同 。 有 些 框架 提供 的 可 调用 程序 属于 底层 (每 个 函数 或 运算 
相对 基本 ， 相 当 于 盖 房 子 的 砖头 ) ， 需 要 编程 人 员 透 彻 理解 神经 网 
络 ， 这 些 底层 程序 库 的 好 处 是 编 出 来 的 程序 灵活 性 高 、 适 用 性 强 、 运 
行 效率 高 。 有 些 框架 提供 的 调用 程序 属于 高 层 〈 每 个 函数 或 运算 复 
杂 ， 相 当 于 盖 房 子 的 预制 板 ， 如 同一 面 墙 。 不 太 懂 神经 网 络 的 人 也 
能 很 容易 编程 ， 但 程序 灵活 性 和 适应 性 受 限 制 ， 运 行 效率 低 。 男 外 一 
个 主要 不 同 之 处 是 程序 库 内 的 范 数 和 运算 的 具体 实现 方法 不 同 ， 有 些 
效率 高 ， 有 些 效率 低 。 关 于 各 主要 编程 框架 在 使 用 单个 和 多 个 GPU 进 
行 机 器 学 习 中 最 常见 的 矩阵 运算 和 卷 积 运算 的 效率 比较 ， 可 以 参见 香 
港 浸 会 大 学 社 晓 文教 授 的 论文 《基准 评测 TensorFlow 、Caffe 、 
CNTK、MXNet、Torch 在 三 类 流行 深度 神经 网 络 上 的 表现 》。 想 更 多 
地 了 解 这 些 编程 框架 的 读者 可 以 参阅 附录 4， 其 列 出 了 目前 业界 的 主要 
编程 框架 。 


开源 社区 与 AI 生 态 


我 们 从 程序 库 的 介绍 可 以 看 出 ， 几 乎 任何 早期 的 机 器 学 习 的 编程 
者 都 会 目 己 编写 一 些 常用 的 函数 和 运算 ， 建 一 个 目 己 用 的 或 目 己 的 公 
司 内 部 用 的 程序 库 。 人 发 源 于 大 学 的 这 些 程序 库 ， 例 如 发 源 于 加 州 伯 殉 
利 大 学 (UC Berkeley) 的 Caffe， 通 常 从 一 开始 就 是 “开源 ”的 ， 也 就 是 
这 些 程序 库 里 面 的 源 代码 都 是 公开 的 。 近 年 来 谷歌 、Facebook、 微 
软 、 亚 马 进 等 公司 也 将 自己 的 程序 库 开 源 。 为 什么 它们 会 如 此 “大 公 无 
私 ”? 当然 这 些 公 司 内 部 推动 开源 的 技术 人 员 中 不 无 理想 主义 者 ， 硕 望 
通过 开源 来 推动 机 妖 学 习 的 快速 发 展 。 但 公司 作为 一 个 营利 主体 ， 开 
源 的 主要 两 业 动 机 是 吸引 更 多 的 软件 编程 人 员 使 用 自己 的 编程 框架 ， 
滋养 一 个 围绕 着 上 自己 的 编程 框 染 的 生态 和 系统。 那么 “开源 ”这 个 游戏 是 


怎么 玩 的 呢 ? 程序 源 代码 开放 后 随便 什么 人 都 可 以 改 ， 如 何 控 制 质 
量 ? 下 面 我 们 就 介绍 一 下 “软件 开源 ”这 个 游戏 的 历史 和 规则 。 

软件 开源 在 美国 有 悠久 的 历史 ， 最 成 功 的 开源 项 目 就 是 互联 网 的 
开发 。 从 1962 年 兰 德 公 司 提出 互联 网 的 概念 ， 到 1968 年 头 三 个 网 络 贡 
点 (斯坦福 大 学 、 斯 坦 福 人 研究 所 、 加 利 福 尼 亚 州 洛杉矶 大 学 ) 的 连 
接 ， 再 到 网 络 协议 TCP/PP 的 开发 和 成 熟 ， 其 间 没 有 任何 政府 部 门 出 面 
组 织 ， 也 不 受 任何 一 家 公司 控制 ， 完 全 靠 社 区 志愿 者 。 美 国 这 个 国家 
就 是 从 社区 到 小 镇 ， 到 州 ， 再 到 联邦 这 样 自 下 而 上 建立 起 来 的 。 当 
1620 年 从 英国 驶 往 新 大 陆 的 “五 月 花 ” 号 轮船 被 季风 从 原来 的 英 王 特许 
地 纽约 吹 到 北边 的 蕊 无 人 烟 的 今天 叫 作 波士顿 的 地 方 时 ， 船 上 的 102 名 
男性 清教徒 在 一 起 订 下 了 “五 月 花 号 圣 约 ”。 这 份 圣 约 就 是 美国 第 一 个 
社区 的 “ 乡 民 公约 ”。 之 后 美国 的 各 个 移民 社区 都 是 这 种 自治 管理 模 
式 ， 没 有 官 ， 也 没有 “上 级 ”>， 所 有 的 社区 都 由 社区 居民 自己 定 规则 ， 
自己 管理 。“ 政 府 * 就 是 自己 订 的 乡 民 公约 。 所 以 在 美国 独立 战争 后 许 
多 人 认为 根本 没有 必要 成 立 一 个 联邦 政府 。 这 种 强大 的 自治 传统 是 开 
源 软件 的 文化 基础 。 所 以 像 互联 网 这 样 无 中 心 ， 没 “领导 ”的 “怪物 ”只 
能 在 美国 成 长 起 来 ， 在 世界 任何 其 他 地 方 都 不 太 可 能 。 这 和 技术 无 
关 ， 而 和 文化 、 历 史 有 关 。 互 联网 的 技术 很 简单 ， 只 要 有 一 台 显 示 终 
端 、 电 话 线 和 提供 信息 的 计算 机 就 可 以 搞 互 联网 了 。 其 实 世 界 上 联网 
最 早 的 国家 不 是 美国 ， 而 是 法 国 。 法 国 1968 年 就 开发 出 
了 “Minitel” (法 国 自 行 建立 的 国家 网 络 ， 建 成 早 于 互联 网 ) ， 由 法 国 
邮电 部 开发 、 控 制 。1982 年 就 在 全 国 铺 开 ， 给 每 个 居民 家 里 面 安装 一 
个 统一 的 终端 ， 通 过 电话 线 连接 到 邮电 部 的 数据 库 里 ， 可 以 查 天 气 、 
订 票 等 。 法 国 这 样 的 欧洲 大 陆 国家 有 做 久 的 呈 权 传统 ， 从 一 开始 束 和 
美国 的 思路 完全 相反 ， 一 切 由 邮电 部 控制 。 在 互联 网 的 冲击 下 ， 法 国 
Minitel 和 其 他 国家 政府 控制 管理 的 互联 网 门户 一 样 早 就 荡然 无 存 。 回 
过 头 看 ， 贺 优 就 沧 一 目 了 然 。 

软件 开源 也 是 一 个 社区 ， 这 个 社区 也 有 乡 民 公 约 ， 这 个 公约 的 主 
要 内 容 就 是 鼓励 每 个 人 分 享 对 开源 软件 的 改进 。 经 过 多 年 的 演进 ， 目 


前 开源 社区 的 公约 大 多 使 用 “Apache2.0 协 议 ”。 这 个 协议 的 主要 规则 如 
下 : 任何 人 都 可 以 使 用 Apache 2.0 协 议 许可 下 的 软件 ， 并 且 可 以 用 于 商 
业 ; 任何 人 都 可 以 任意 修改 原 有 的 软件 ， 并 将 修改 后 的 软件 申请 商标 
和 专利 ， 但 修改 的 软件 必须 注 明 使 用 了 Apache 2.0 的 许可 ， 必 须 明 确 标 
示 修 改 的 部 分 。 


开源 社区 允许 在 开源 软件 的 基础 上 开发 目 己 的 商用 软件 ， 而 大 多 
数 商 用 软件 是 不 愿意 公开 的 。 那 么 开源 社区 如 何 解决 “搭便 车 ”的 问题 
呢 ? 这 个 问题 束 像 问 为 什么 总 有 人 愿意 出 头 为 社 群 出 力 ， 为 什么 人 会 
有 利他 的 动机 。 答 案 在 于 种 群 的 竞争 和 演化 。 设 想 远古 两 个 邻近 的 部 
落 ， 第 一 个 部 落 里 面 的 所 有 人 都 很 目 私 ， 另 一 个 部 落 里 面 有 些 人 愿意 
为 大 家 冒 风险 和 做 事 ， 第 二 个 部 落 的 合作 能 力 和 战斗 力 整 会 比 第 一 个 
强 ， 两 个 部 落 发 生 战 争 时 第 二 个 部 落 束 会 把 第 一 个 部 落 消 炙 了 。 那 
些 “ 纯 目 私 * 的 人 的 基因 就 无 法 遗传 下 来 ， 而 获胜 存活 下 来 的 基因 中 下 
会 有 利他 成 分 。 束 像 我 们 在 日 常生 活 中 看 到 的 一 样 ， 一 个 社 群 中 愿意 
牺牲 目 己 的 利益 为 大 家 服务 的 人 虽然 总 是 极 少 数 但 永远 存在 。 开 源 社 
区 其 实 十 同一 个 道理 ， 在 里 面 免 费 干 活 不 断 改进 软件 的 人 也 是 少数 ， 
所 以 许多 开源 社区 都 是 一 路 艰难 。 但 是 对 于 那些 逐渐 成 为 重要 基础 设 
施 的 开源 软件 ， 例 如 互联 网 协议 、 操 作 系 统 Linux 等 ， 束 会 有 更 多 的 人 
来 天 心 和 付出 。 例 如 许多 商业 公司 使 用 了 这 些 开源 软件 ， 一 旦 公司 做 
大 ， 这 些 公 司 就 非 尝 关心 这 些 开源 软件 的 改进 、 更 新 和 安全 。 这 些 公 
司 束 会 出 钱 出 力 。 还 有 一 些 用 户 也 会 捐献 ， 许 多 第 年 依赖 维基 百科 学 
习 和 检索 的 读者 ， 因 为 布 望 这 个 工具 越 来 越 有 用 ， 束 会 定期 捐 球 文 
持 。 笔 者 已 经 不 能 想象 离开 维基 百科 这 样 的 工具 该 怎么 工作 和 生活 。 
但 以 上 这 些 因素 仍然 没 能 彻底 解决 开源 社区 “搭便 车 ”的 问题 。 这 和 我 
们 在 一 个 社 群 社区 的 情况 完全 相同 ， 总 有 人 会 “搭便 车 ”。 区 块 链 技术 
的 出 现 也 许 能 彻 确 解 决 这 个 问题 ， 这 又 是 一 个 很 长 的 话题 。 笔 者 也 许 
会 在 下 一 本 关于 区 块 链 对 社会 的 冲击 的 书 中 详 述 。 

所 以 有 了 开源 的 编程 框 染 以 后 ， 大 量 的 AI 应 用 开发 公司 束 可 以 使 
用 现成 的 程序 库 而 不 必 从 头 开 始 。 这 束 大 大 降低 了 AI 应 用 的 技术 门 


棍 。 一 个 不 仅 机 需 学 习 的 有 经 验 的 软件 工程 师 ， 可 以 用 一 个 月 时 间 在 
网 上 学 一 门 机 需 学 习 的 基础 课程 ， 再 伦 一 周 时 间 束 可 以 掌握 像 谷歌 的 
TensorFlow 这 样 的 编程 框架 。 所 以 今天 融资 的 新 创 技术 型 公司 都 可 以 
说 目 己 十 “AI 公 司 ”。 如 果 这 些 公 司 的 技术 都 使 用 开源 编程 框架 ， 它 们 
的 技术 差别 就 很 小 。 因 此 这 些 公 司 比拼 的 是 对 某 个 行业 的 理解 和 在 该 
行业 的 膏 销 能 力 ， 以 及 对 该 行业 数据 的 占 先 和 占有 程度 。 有 AI 技 术 实 
力 的 公司 通常 不 完全 依赖 开源 的 编程 框架， 而 是 目 己 开发 很 多 目 己 专 
用 的 的 层 程序 库 ， 甚 至 有 有 目 己 的 编程 框架 。 


在 AI 的 开源 运动 中 ， 除 了 各 大 学 和 各 大 技术 公司 的 开源 编程 杠 
涤 ， 还 有 一 些 纯粹 的 公益 组 织 。 其 中 最 车 名 的 就 是 由 “钢铁 侠 ” 马 斯 元 
迄今 最 成 功 的 摔 化 器 之 一 Y Combinator 的 创始 人 山姆 : 艾 特 曼 (Sam 
Atman) 创建 的 Open AI。 创 办 Open AI 的 动机 有 两 个 : 一 是 不 能 让 大 
公司 控制 人 类 未 来 最 重要 的 技术 之 一 。 这 一 点 和 当年 乔布斯 、 盖 次 发 
起 个 人 电脑 革命 时 的 驱动 力 相 同 : 不 能 让 IBM 这 样 的 大 公司 垄断 计算 
机 技术 。 二 是 现在 就 开始 警惕 AI 对 人 类 社会 的 潜在 威胁 (我 们 将 在 第 
七 章 专门 讨论 此 问题 ) 。Open AI 的 使 命 是 “AI 民主 化 ”。 意 思 是 要 让 更 
多 的 人 掌握 AI 技术 ， 让 更 多 的 人 受 圳 于 AI。 也 有 人 反驳 说 让 每 个 人 都 
掌握 一 种 威力 无 比 强 大 的 技术 是 否 使 人 类 更 安全 ? 应 该 说 对 AI 的 担心 
是 明确 的 ， 但 如 何 使 AI 更 安全 的 路 径 是 模糊 的 。 但 这 束 是 那些 创业 家 
的 性 格 ， 只 要 大 方 各 对 了 就 完 干 起 来 再 说 。Open AI 的 最 大 挑战 是 如 何 
吸引 第 一 流 的 人 才 。 在 硅谷 ， 顶 级 的 AIL 人 才 的 工资 、 奖 金 、 期 权 加 起 
来 每 年 可 达 数 百 万 美元 ， 而 Open AI 作 为 一 家 非 营 利 性 机 构 ， 只 能 给 
一 般 的 市 场 价 (例如 每 年 20 万 ~30 万 美元 ) 。 即 使 如 此 ， 也 曾经 吸引 了 
重量 级 的 AI 大 神 ， 例 如 发 明了 生成 对 抗 网 络 的 岩 : 古 德 菲 勒 〈Ian 
Goodfellow) 等 人 。Open AI 的 主要 人 研究 工作 集中 在 通用 人 工 知 能， 使 
用 开源 社区 的 方法 吸引 全 世界 的 AL 人 才 来 页 献 。Open AI 是 否 能 够 最 终 
成 为 AI 生态 中 的 一 文 重要 力量 ， 还 要 看 他 们 的 研究 结果 是 否 能 被 广泛 
应 用 ， 要 看 这 些 为 理想 而 来 的 年 轻 人 能 否 禁 得 住 市 场 以 10 售 以 上 的 每 
过 把 他 们 挖 走 。 


乱世 内 雄 


今天 的 AI 就 像 20 年 前 的 互联 网 ， 是 兵家 必 争 之 地 。 几 乎 所 有 的 大 
公司 都 在 争夺 高 地 。 其 中 最 有 代表 性 的 就 是 世界 上 几 大 科技 和 互联 网 
巨头 : 合 歌 、Facebook、 亚 蕊 还 、 微 软 、IBM、 百 度 、 阿 里 巴巴 、 腾 
讯 等 。 这 些 巨头 可 以 分 为 三 类 : 第 一 类 是 掌握 大 量 用 户 数 据 的 互联 网 
公司 ; 第 二 类 是 微软 和 IBM 这 样 的 技术 公司 ; 第 三 类 是 华为 、 小 米 等 
这 类 缺乏 数据 ， 但 有 应 用 场景 ， 又 和 希望 通过 AI 提升 自身 产品 的 公司 。 
第 一 类 公司 首先 在 目 己 的 数据 上 全 面 使 用 AI 技术 ， 例 如 图 上 乒 搜 索 、 用 
户 行 为 预测 、 智 能 推荐 等 。 第 二 类 公司 则 和 希望 打造 AI 云 计算 让 客户 使 
用 。 第 三 类 公司 积极 和 前 两 者 进行 合作 ， 或 快速 将 它们 的 AI 开源 能 力 
运用 到 目 身 的 产品 中 。 

在 互联 网 公司 中 ， 技 术 张 动 型 的 公司 例如 谷歌 和 百度 都 是 在 AI 战 
上 略 上 最 激进 的 公司 。 合 歌 放弃 了 “移动 第 一 ”的 战略 ， 提 出 “AI 第 一 ”的 
新 战略 。 百 度 也 宣称 自己 是 一 家 AI 公司 ， 要 全 力 以 赴 投 入 AI (all in 
AI) 。 合 歌 和 百度 除了 在 自己 的 数据 优势 上 全 面 使 用 AI 以 外 ， 也 四 面 
出 击 ， 企 图 进入 目 己 不 占有 数据 优势 的 垂直 行业 ， 例 如 目 动 当 驶 和 医 
疗 健康 行业 。 中 美的 搜索 公司 在 进入 垂直 行业 上 比 社交 网 络 和 电子 商 
务 公司 更 激进 的 另外 一 个 原因 是 搜索 公司 的 用 户 数据 比 社交 和 商务 的 
用 户 数据 “ 线 ”， 欣 掘 的 价值 没有 社交 和 商务 用 户 高 。 

这 些 互联 网 和 科技 巨头 都 在 云 计算 方向 上 激烈 竞争 ， 每 家 都 硕 望 
目 己 的 AI 云 计 算 占 有 最 大 的 市 场 份 笑 ， 亚 马 进 、 人 谷歌 、 百 度 、IBM、 
腾讯 等 都 在 其 云 计 算 平 台 推 出 了 计算 机 视觉 、 语 音 识 别 、 目 然 语 言 处 
理 、 翻 译 等 能 力 。 谷 歌 传 统 的 云 计 算 市 场 份额 远 不 如 亚马逊 ， 但 AI 为 
其 提供 了 一 个 翻身 的 机 会 。 合 歌 开 发 自己 的 TPU， 除 了 降低 成 本 以 
外 ， 更 重要 的 是 TPU 能 够 对 TensorFlow 编 程 框架 下 的 计算 提供 更 快 的 
计算 。 相 对 于 亚马逊 的 云 服务 AWS 等 竞争 对 手 ， 谷 歌 不 仅 可 以 提供 成 
本 更 低 、 拥 有 更 强 AI 能 力 的 云 计算 服务 ， 还 可 以 进一步 吸引 更 多 的 人 


使 用 合 歌 的 编程 框架 TensorFlow。 这样 TensorFlow 和 合 歌 的 云 计 算 服 务 
的 绑 定 就 越 紧 密 ，TensorFlow 和 基于 TPU 的 云 计算 了 驶 形成 了 正 循环 。 
目前 TensorFlow 的 SDK (开发 工具 包 ) 在 全 球 有 1 000 万 次 下 载 ， 电 布 
180 个 国家 和 地 区 。 同 时 谷歌 云 AI 团队 正在 快速 降低 AI 技术 上 的 门 
槛 。2018 年 初 ， 谷 歌 发 布 全 新 的 “ 目 动机 器 学 习 云 ” (Cloud 
AutoML) ， 不 会 用 谷歌 编程 框架 或 任何 编程 框架 的 人 也 可 以 创建 机 峰 
学 习 模 型 ， 用 户 只 需 上 传 数 据 便 能 自动 创建 机 絮 学 习 模 型 ， 包 括 训练 
和 调试 。 目 前 已 经 有 上 万 家 企业 使 用 谷歌 的 自动 机 器 学 习 云 服务 。 

华为 在 通信 设备 、 移 动 终端 领域 有 领先 优势 ， 虽 然 该 公司 很 早 就 
部 署 了 AI， 但 是 在 AI 技 术 上 整体 还 是 大 幅 落 后 于 谷歌 、 百 度 这 类 公 
司 。 因 此 该 公司 采用 了 全 面 开 放 合 作 的 态度 ， 构 建 目 身 的 AI 能 力 ， 以 
便 升级 现 有 的 产品 与 服务 能 力 。 华 为 通过 开放 平台 的 搭建 ， 在 心 厂 层 
一 开始 采用 了 寒 武 纪 的 NPU 〈 舱 入 式 神经 网 络 处理 器 ) ， 在 语音 交互 
方面 采用 了 科大 讯 飞 和 目 主 研发 相 结合 ， 并 通过 开放 的 架构 和 战略 合 
作 将 谷歌 的 TensorFlow、 百 度 的 Paddle Paddle 等 深度 学 习 能 力 便捷 地 提 
供给 开发 者 与 合作 伙伴 ， 并 和 微软 联合 开发 内 置 于 系统 层 的 机 器 翻译 
功能 ， 以 及 和 商 淘 等 公司 联合 开发 AI 技 术 ， 以 便 为 旗下 产品 打造 更 多 
的 AI 型 应 用 ， 拉 开 和 竞争 对 手 的 距离 。 


大 卫 和 哥 利 亚 


大 公司 既 有 技术 又 有 数据 ， 那 新 创 公 司 怎 么 活 ? 简单 来 讲 ， 新 创 
的 AI 公司 要 进入 大 公司 不 占有 数据 优势 的 那些 垂直 的 行业 。 这 样 的 行 
业 又 可 以 分 为 两 类 : 一 类 是 新 兴 领 域 ， 以 前 完全 没有 人 做 ， 一 切 从 头 
开始 ; 另 一 类 征 原 有 行业 ， 例 如 金融 、 保 险 、 能 源 等 。 新 创 公 司 进 入 
第 一 类 行业 最 容易 ， 因 为 大 公司 通 音 不 会 进入 一 个 全 新 的 、 市 场 还 未 
知 的 领域 ， 目 动 芝 驶 和 人 脸 识 别 都 是 这 样 的 新 兴 领 域 。 目 前 在 类 国 和 


中 国 做 目 动 驾 驶 的 新 创 公司 有 上 百 家 ， 在 中 国 做 人 脸 识 别 的 公司 也 有 
数 百 家 。 与 任何 新 兴 领 域 一 样 ， 这 些 新 创 公 司 的 大 部 分 将 被 淘汰 或 并 
购 ， 尤 其 是 目 动 当 驶 ， 其 属于 未 来 汽车 三 商 之 间 竞 争 的 核心 技术 ， 又 
牵涉 到 安全 。 大 车 三 不 可 能 把 这 样 的 技术 交 给 一 家 创业 公司 《二 流 以 
下 车 广 有 可 能 ， 所 以 还 是 有 市 场 的 ) 。 它 们 要 么 自己 建 研发 队伍 ， 要 
么 收购 最 好 的 目 动 驾驶 软件 公司 ， 目 前 几乎 所 有 的 一 线 国 际 大 车 厂 痢 
已 经 这 么 做 了 。 目 动 当 驶 软件 公司 遇 到 的 第 二 个 问题 是 它们 的 软件 通 
常 要 通过 一 级 供应 商 (Tier1) 的 集成 后 进入 车 厂 。 但 一 流 的 一 级 供应 
商 也 认为 目 动 当 驶 是 它们 未 来 的 核心 竞争 力 ， 也 是 要 么 目 建 研 发 ， 要 
么 收购 ， 也 不 会 把 人 命 天 天 的 事 交 给 一 家 新 创 公 司 。 所 以 那些 没 能 被 
收购 的 目 动 要 驶 软件 公司 最 后 要 么 去 攻 比 较 人 简单 的 、 限 定 的 场景 ， 例 
如 校园 、 景 区 、 小 区 等 ， 要 么 去 攻 垂 直 市 场 ， 例 如 卡车 、 港 口 、 仓 库 
等 。 而 人 脸 识 别 由 于 应 用 场景 不 同 ， 客 户 要 求 不 同 (例如 发 现 犯 罪 分 
子 和 刷 脸 文 付 要 求 完 全 不 同 ) ， 所 以 可 以 容纳 更 多 的 厂家 存活 。 


现在 难以 看 清楚 的 是 那些 既 有 和 钱 又 有 数据 的 传统 行业 ， 例 如 金 
融 、 能 源 、 医 疗 等 。 在 这 些 领 域 有 三 类 苋 搜 者 :第 一 类 是 本 行业 内 部 
的 团队 ， 例 如 许多 证 券 公司 已 经 开始 大 规模 目 建 AI 交 易 和 理财 团队 。 
第 二 类 是 各 大 互联 网 公司 企图 挟 巨 大 技术 优势 进入 或 者 颠覆 传统 行 
业 ， 例 如 谷歌 和 腾讯 都 企图 进入 医疗 领域 。 第 三 类 是 企图 进入 王 直 行 
业 的 新 创 AI 公司 。 两 个 有 意思 的 行业 是 证 券 艾 易 和 医疗 图 像 。 前 者 几 
乎 都 在 建立 目 己 的 团队 和 能 力 ， 而 后 者 则 基本 都 和 外 面 合作 。 对 于 证 
券 公司 来 讲 ，AI 算 法 是 未 来 交易 的 核心 技术 ， 证 券 公司 必须 擎 握 。 区 
易 算 法 必须 由 技术 团队 和 交易 团队 紧密 配合 快速 迭代 ， 算 法 和 数据 必 
须 严 格 保 密 ， 所 以 很 难 外 包 。 而 医疗 成 像 识 别 目前 主要 古 提 高 X 光 读 
片 效率 ， 不 是 生死 亿 关 的 撤 术 ，X 光 读 片 对 于 一 家 医院 来 说 只 是 很 小 
的 一 部 分 业务 。 美 国 的 大 连锁 医疗 集团 例如 凯撒 (Kaiser 
Permanente) 等 还 有 一 些 内 部 的 技术 资源 ， 大 部 分 美国 和 中 国 的 医院 
基本 没有 这 样 的 技术 能 力 。 医 疗 图 片 即使 泄露 到 同行 手 里 ， 对 医院 本 
喘 也 不 会 造成 致命 伤害 。 所 以 它们 愿意 承包 给 外 面 做 。 新 创 AI 企业 是 


否 能 顺利 进入 传统 行业 ， 要 看 AI 技 术 在 这 个 行业 中 的 作用 和 对 数据 的 
敏感 程度 。 预 计 银行 和 保险 行业 将 和 证 券 业 类 似 ， 不 会 愿意 分 至 数据 
外 包 AI， 大 银行 和 保险 公司 都 将 以 目 己 为 主 。 所 以 AI 公司 只 能 去 攻 那 
些 中 小 规模 的 企业 ， 它 们 目 己 没有 技术 能 力 ， 又 面临 被 淘汰 的 危险 。 
还 有 一 种 做 法 束 古 与 新 业态 合作 ， 例 如 新 兴 互 联网 银行 、 互 联网 保 
分。 这 些 公 司 有 互联 网 和 大 数据 基因 ， 属 于 行业 新 进入 者 ， 做 法 激 
进 ， 天 然 拥抱 AI 技 术 。 但 对 这 类 公司 来 说 ，AI 将 是 核心 技术 ， 它 们 最 
终 还 是 要 目 己 做 ， 也 许 会 收购 外 包 团 队 。 

总 体 来 讲 ， 今 天 AI 创业 公司 进入 传统 行业 的 商业 模式 还 都 不 清 
晰 ， 如 果 有 选择 ， 那 么 在 为 传统 行业 增加 效率 和 从 外 部 颠 黎 传 统 行业 
两 者 之 间 ， 前 者 更 容易 ， 但 后 者 利益 更 大 。 


许多 人 今天 对 AI 新 创 公 司 的 一 个 担忧 吏 是 用 户 数据 都 在 互联 网 巨 
头 手 里 。 这 是 一 种 静态 的 看 法 ， 今 天 互联 网 公司 的 数据 主要 是 人 们 使 
用 电脑 和 手机 产生 的 浏览 数据 ， 它 们 并 不 掌握 下 列 几 大 类 对 人 类 有 用 
的 ，AI 也 需要 用 的 数据 。 


(1) 人 类 本 身 的 数据 ， 例 如 身体 数据 和 心理 数据 。 
(2) 环境 数据 ， 其 中 包括 自然 环境 、 社 会 环境 。 
(3) 各 种 人 类 劳动 过 程 数 据 ， 例 如 农业 、 工 业 、 服 务 业 的 过 程 数 


据 。 


人 类 劳动 过 程 中 的 数据 十 未 来 最 重要 的 数据 ， 劳 动 过 程 元 非 钙 对 
一 个 给 定 的 环境 施加 一 组 行为 ， 让 这 个 给 定 的 环境 变 得 对 人 类 更 有 利 
(例如 给 一 块 地 播种 、 汉 水、 施肥 ， 使 之 长 出 庄稼， 痛 炼 铁 矿石 变 成 
钢 ， 给 患者 打针 吃 药 治 愈 疾病 ) 。 只 要 这 个 环境 能 够 被 测量 (庄稼 再 
产 、 矿 石和 钢铁 质量 、 人 体 健康 程度 ， 这 组 行为 能 够 被 控制 ( 浇 水 
施肥 量 、 高 炉 温 度 、 药 的 种 类 剂量 ) ， 机 妖 学 习 束 可 以 被 用 来 优化 这 
个 过 程 。 所 以 一 切 能 够 被 测量 的 环境 和 过 程 都 将 产生 机 器 学 习 需 要 的 
数据 。 几 十 年 以 后 回头 再 看 ， 人 类 上 网 和 玩 手 机 产生 的 那 点 数据 根本 


束 不 叫 数据 。 如 果 把 数据 比 作 金 矿 ， 那 么 互联 网 巨头 今天 拥有 的 无 非 
征地 表面 沙土 里 一 层 浅 浅 的 金沙 ， 真 正 的 金 净 将 都 还 埋 在 迄今 没 发 现 
的 地 方 。 这 些 地 方 有 些 是 我 们 前 面 提 到 的 现 有 行业 ， 有 些 是 我 们 今天 
还 没 看 到 的 环境 和 过 程 。 随 着 各 类 传 感 右 成 本 的 降低 ， 越 来 越 多 的 环 
境 被 更 细密 地 感知 。 随 着 物 联 网 的 普及 ， 这 些 无 所 不 在 的 传 感 紫 将 搜 
集 到 比 今天 互联 网 大 许多 数量 级 的 数据 。 


新 创 公 司 和 大 公司 竞 搜 的 最 大 的 优势 还 古人 才 和 激励 机 制 。 创 业 
者 通 闻 都 是 最 优秀 、 最 有 激情 、 敢 于 冒险 的 一 批 人 。 新 创 公 司 在 一 个 
全 新 领域 可 以 随时 掉头 ， 快 速 枯 代 ， 了 迅 速 摸 清 市 场 需求 ， 它 们 所 有 的 
脑筋 都 会 放 在 如 何 满足 用 户 需 求 上 。 而 在 大 公司 很 少 有 人 愿意 冒 风险 
闫 试 新 东西 ， 有 些 项 目 会 率 涉 许多 部 | 利益 ， 想 做 一 件 事 要 人 花 大 量 时 
间 去 协调 ， 有 时 还 会 打 得 不 可 开交 。 几 是 在 大 公司 等 过 的 人 对 此 部 深 
有 体会 。 以 半 目 动 要 驶 功能 为 例 ， 特 斯 拉 率 先 推 出 目 动 线 道 保持 功 
能 ， 使 当 驶 员 开 车 时 可 以 不 扶 方 问 僵 。 这 个 线 道 识 别 撤 术 最 初 是 以 色 
列 公司 Mobileye 提 供 的 ， 其 他 使 用 Mobileye 方 案 的 汽车 三 家 按理 说 都 
可 以 推出 这 个 功能 但 却 没有 ， 因 为 这 个 功能 风险 很 大 。 传 统 车 广 的 中 
高 层 经 理 打 死 都 不 会 签字 发 布 这 个 功能 ， 后 来 也 确实 出 现 了 交通 事故 
的 例子 。 特 斯 拉 发 布 这 样 的 功能 极 可 能 就 是 老板 目 己 招 的 板 ， 因 为 除 
了 利益 之 外 ， 创 始 人 天 天 泡 在 产品 上 ， 对 细 市 非常 了 解 ， 拍 板 时 心里 
多 少 有 数 。 一 个 痢 功 能 谁 都 无 法 打包 票 ， 不 冒 这 样 的 风险 束 无 法 在 目 
动 当 驶 技术 上 领先 ， 无 法 领先 新 创 公 司 吏 存活 不 下 去 。 而 传统 大 公司 
的 CEO 都 是 职业 经 理 人 ， 对 某 个 具体 功能 不 可 能 了 解 得 那么 细 ， 要 依 
赖 一 层 一 层 的 建议 ， 如 果 下 面 没 人 愿意 担 这 个 风险 ，CEO 束 不 敢 随 便 
签字 。 传 统 大 公司 的 第 二 个 问题 是 激励 机 制 无 法 和 独创 公司 比 。 大 公 
司 那 点 资金 和 期 权 没 法 与 创业 公司 的 期 权 比 (如果 成 功 ) ， 大 公司 内 
部 的 人 事 斗 争 和 协调 成 本 都 会 把 那些 智商 高 的 技术 天 才 吓 跑 ， 即 使 招 
来 也 会 气 走 。 传 统 车 三 有 货 金 、 渠 道 ， 甚 至 也 掌握 了 相应 的 技术 ， 由 
于 上 述 种 种 原因 也 只 能 眼睁睁 地 看 着 特 斯 拉 这 样 的 公司 导出 头 来 把 它 
们 甩 得 越 来 越 远 。 


AI 的 技术 推动 力 


许多 人 都 在 关心 AI 这 波 行情 还 能 走 多 高 、 走 多 远 。 如 果 说 算法 是 
AI 引擎 的 设计 ， 算 力 是 引擎 的 马力 ， 数 据 是 引擎 的 燃料 ， 那 么 让 我 们 
分 别 看 看 这 些 技 术 推动 力 的 发 展 。 


算法 


前 面 介绍 过 ， 目 前 新 算法 层出不穷 ， 有 些 在 继续 沿 着 神经 网 络 的 
方 问 走 ， 有些 开始 探讨 其 他 路 径 ， 例 如 贝 叶 斯 网 络 、 文 持 问 量 机 ， 有 
些 在 把 不 同 的 算法 融合 起 来 ， 有 的 干脆 另辟蹊径 ， 提 出 新 的 人 脑 认 知 
模型 。 算 法 的 研究 目前 非常 活跃 ， 在 未 来 5~10 年 还 会 有 大 量 新 的 算法 
涌现 。 


算 力 


算 力 的 增加 基于 摩尔 定律 。 目 前 除了 芯片 的 线 宽 继续 变 窗 (最 新 
半导体 工艺 线 宽 4 纳 米 ) 导致 集成 度 继续 变 高 以 外 ， 还 有 各 种 封装 技 
术 ， 例 如 三 维 蕊 片 封装 可 以 将 64 个 心 片 把 在 一 起 。 目 前 芯片 的 耗 电 比 
人 脑 耗 电 还 大 几 个 数量 级 ， 在 许多 数据 中 心 能 耗 成 为 制约 瓶 贷 ， 大 幅 
度 降 低 耗 电 也 是 必 片 设计 的 重要 方向 。 虽 然 单个 心 片 计算 能 力 的 增长 
变 缓 ， 但 是 现在 倾 回 于 用 越 来 越 多 的 必 片 。 对 于 AI 计算 来 讲 ， 不 论 是 
训练 还 是 识别 ， 重 要 的 不 仅 是 单个 心 片 的 能 力 ， 更 是 能 够 把 多 少 世 乒 
有 效 地 组 织 在 一 起 来 完成 一 个 计算 任务 。2012 年 以 前 还 很 少 使 用 
GPU， 现 在 一 个 计算 任务 动 辑 使 用 成 和 于 上 万 个 GPU 或 专用 计算 心 
例如 TPU。2018 年 Open AI 发 布 的 一 份 报告 显示 ， 目 2012 年 以 来 ， 在 Ai 


训练 运行 中 所 使 用 的 计算 能 力 呈 指数 级 增长 ， 每 3.5 个 月 增长 一 倍 。 
2012 一 2018 年 ， 这 个 指标 已 经 增长 了 30 万 售 以 上 。 具 体 说 束 是 2018 年 
合 歌 的 AlphaGo Zero 比 2012 年 ImageNet 大 赛 获胜 的 AlexNet 快 了 30 万 


倍 。 


数据 


数据 的 增加 基于 传感器 或 存储 器 越 来 越 便宜 ， 几 乎 所 有 传感器 和 
存储 器 的 成 本 都 是 由 芯片 成 本 决定 的 。 当 芯片 集成 度 提高 ， 芯 片 需求 
量 增 大 时 ， 传 感 器 和 存储 器 的 成 本 会 大 幅度 下 降 ， 更 多 的 传感器 会 产 
生 更 多 的 数据 。 

综 上 所 述 ， 推 动 AI 的 三 个 技术 要 素 都 在 快速 发 展 ， 所 以 目前 AI 只 
是 莱特 兄弟 刚刚 把 飞机 飞 离 地 面 ， 离 5 马赫 超 音速 还 很 远 。 

从 市 场 看 ， 目 前 受到 AI 冲 击 的 传统 行业 还 很 少 ， 大 部 分 行业 还 没 
有 开始 被 改造 、 被 颠覆 ， 因 为 AI 从 业者 都 在 忙 乎 进入 那些 没有 传统 
头 的 行业 ， 例 如 人 脸 识别 和 自动 芍 驶 。 

图 4.3 是 一 个 很 著名 的 “新 技术 成 熟 曲 线 ”。 互 联网 过 去 20 多 年 的 发 
展 就 非常 符合 这 条 曲线 : 一 个 新 的 重大 技术 创新 一 开始 没 多 少 人 相 
信 ， 但 超过 一 个 转折 点 后 就 开始 被 热 炒 ， 大 家 的 期 望 值 都 很 高 ， 大 量 
的 资金 盲目 进入 ， 很 快 发 现 技 术 还 不 成 熟 ， 远 不 能 达到 期 望 值 ， 大 家 
都 很 失望 ， 行 业 跌 落 到 谷底 。 但 这 个 技术 其 实 只 是 需要 时 间 ， 经 过 一 
段 时 间 成 熟 起 来 ， 就 会 重新 站 上 高 地 。 就 互联 网 来 说 ， 今 天 的 发 展 远 
远 超 过 了 2000 年 泡沫 时 最 狂 野 的 想象 。 


可 见 性 


期 望 膨胀 期 


平衡 成 熟 期 


技术 萌芽 期 时 间 


图 4.3 新 技术 成 熟 曲线 


图 片 来 源 : https://www.gartner.com/smarterwithgartner/whats-new-in-gartners-hype-cycle- 
foremerging-technologies-2015/° 


那么 AI 处 在 这 条 曲线 的 什么 位 置 呢 ? 大 约 在 峰值 刚 过 ， 还 远 示 到 
低谷 。 注 意 这 条 曲线 只 是 个 一 般 性 规律 ， 并 不 准确 ， 也 不 一 定 适 用 所 
有 新 技术 ， 即 许多 新 技术 都 会 经 历 这 么 两 个 起 伏 ， 但 不 同 的 技术 起 伏 
幅度 不 同 。 笔 者 预测 AI 有 “冷静 期 * 而 没有 “2] 火 期 *， 因 为 AI 在 许多 行 
业 都 已 经 证 明 有 有 用。 回头 看 过 去 几 年 还 是 有 一 些 泡沫 ， 泡 沫 体现 在 某 
些 领域 出 现 大 量 同 质 化 公司 和 这 些 领 域 融 资 的 估 值 上 面 。 据 不 完全 统 
计 ， 中 美 两 国 的 目 动 芝 驶 公司 已 经 超过 100 家 ， 中 国 号 称 做 人 脸 识别 的 
公司 有 数 百 家 。 显 然 市 场 不 需要 这 么 多 家 企业 。 在 目 动 区 驶 领域 一 个 
没有 任何 收入 ， 也 看 不 到 清晰 商业 模式 的 公司 可 以 喊 价 到 数 亿 美元 的 
信 值 。 佑 值 泡 沫 通常 部 是 由 于 一 次 估 值 离谱 的 收购 造成 的 。 通 用 汽车 
公司 在 2016 年 宣称 以 10 亿 类 元 的 佑 值 收 购 了 位 于 旧金山 的 Cruise 
Automation， 以 后 所 有 的 目 动 驾驶 公司 都 以 这 次 收购 作为 目 己 估 值 的 


对 标 。 所 有 投资 自动 要 敢 公 司 的 投资 者 都 赌 上 自己 投资 的 公司 也 会 被 高 
价 收 购 。 但 是 即使 所 有 大 的 整 车 三 商都 收购 一 家 目 动 要 驱 软 件 公 司 ， 
市 场 也 不 需要 上 百 家 同 质 化 的 公司 。 当 供 大 于 求 时 ， 收 购 价 格 也 会 大 
幅度 降低 。 笔 者 预计 在 今后 2~3 年 中 ， 大 部 分 同 质 化 公司 在 资金 耗 尽 后 
将 因为 无 法 进一步 融资 而 死亡 ， 与 此 同时 ， 少 数 几 家 技术 独特 或 市 场 
能 力 强 且 资 金 雄厚 的 公司 将 快速 发 展 。 

目前 许多 融资 的 新 创 公 司 都 宣称 目 己 是 AI 公司 或 者 使 用 AI 技术 。 
但 这 些 公司 的 技术 大 多 是 用 几 大 公司 的 开源 编程 框架 ， 例 如 合 歌 的 
TensorFlow 和 英 伟 达 的 GPU 或 者 市 场 上 的 云 计 算 服 务 。 技 术 高 度 同 质 
化 ， 没 有 任何 壁 爸 。 就 像 当 年 任何 公司 都 说 自己 是 .com 公 司 一 样 。 那 
么 我 们 如 何 判断 一 家 AI 创业 公司 的 价值 呢 ? 首先 ， 应 该 看 是 否 能 够 拿 
到 别人 拿 不 到 的 数据 。 做 到 这 一 点 很 难 ， 你 能 拿 到 的 数据 别人 通常 也 
能 拿 到 。 如 果 不 能 独占 数据 ， 那 就 要 看 有 多 大 先 发 优势 。 如 果 进 入 一 
个 行业 早 ， 通 过 快速 迭代 ， 让 自己 的 模型 在 这 个 行业 中 变 得 有 用 ， 就 
可 以 得 到 更 多 的 数据 和 资源 ， 后 进 者 即使 拿 到 同样 的 数据 ， 模 型 质量 
靳 也 打 不 进去 。 其 次 ， 要 看 该 企业 对 所 进入 行业 的 独到 理解 和 业务 开 
发 、 落 地 能 力 。 当 然 如 果 能 够 针对 本 行业 在 算法 上 有 突破 ， 束 能 够 大 


大 提高 进入 壁 仅 。 


AI 与 互联 网 的 三 个 区 别 


这 次 AI 创新 浪潮 堪 比 互联 网 ， 但 是 AI 浪潮 和 互联 网 浪潮 有 三 个 区 
别 。 

第 一 个 区 别 是 AI 从 一 开始 就 要 颠覆 传统 行业 。 互 联网 1994 年 起 步 
时 从 经 济 的 边缘 开始 ， 和 传统 产业 似乎 一 点 关系 都 没有 ， 没 有 人 懂 一 
个 网 站 能 干什么 。 互 联网 20 多 年 来 逐步 从 边缘 蚕食 中 心 ， 直 至 今日 影 
响 每 个 行业 。 但 即使 是 今天 ， 互 联网 对 制造 业 、 农 业 、 建 筑 业 、 交 通 


运输 等 搬运 原子 的 行业 的 影响 也 局 限 在 媒体 和 时 销 方面 ， 没 有 进入 制 
造 业 的 核心 。 而 AI 的 特点 是 从 第 一 天 起 束 从 传统 产业 中 心 爆 炸 ， 目 动 
当 驶 对 汽车 行业 的 颠 禾 就 是 一 个 典型 的 例子 。 


第 二 个 区 别 是 技术 驱动 。 互 联网 除了 搜索 以 外 基本 没有 太 多 技 
术 ， 主 要 是 应 用 和 商业 模式 。 互 联网 创业 者 完全 可 以 是 不 懂 技 术 的 
人 。 目 前 为 止 AI 创 业者 以 技术 大 拿 居 多 。 当 然 随 着 AI 技 术 的 普及 ， 许 
多 有 商业 头脑 的 人 只 要 看 明白 AI 在 一 个 行业 的 价值 也 可 以 拉 起 一 家 公 
司 ， 但 目前 最 稀缺 的 是 AI 的 高 级 技术 人 才 。 


第 三 个 区 别 是 可 能 不 会 出 现 平 台 性 公司 或 赢家 “ 通 吃 ”的 局 面 。 互 
联网 的 一 个 特点 是 连接 供需 双方 ， 一 旦 用 户 超过 一 个 门限 ， 后 来 者 就 
很 难 赶 上 ， 所 以 很 容易 形成 启 家 “ 通 吃 ” 的 局 面 。 但 在 AI 产业 里 目前 还 
没有 看 到 这 样 的 机 会 ， 不 论 是 自动 区 驶 还 是 人 脸 识别 都 是 一 个 一 个 山 
头 去 攻 ， 无 法 在 短期 内 形成 垄断 。 造 成 融资 泡沫 的 一 个 重要 原因 就 是 
有 些 投资 人 还 以 为 AI 和 互联 网 一 样 启 家 “ 通 吃 ， 只 要 投 中 第 一 名 ,多 
贵 都 值 。 


简单 用 一 句 话说 就 是 互联 网 是 to C (对 用 户 ) 的 生意 ，AI 是 to B 
(对 企业 ) 的 生意 。AI 中 to C 的 生意 都 会 被 现 有 互联 网 巨头 吸纳 ， 创 
业者 的 机 会 在 于 to B。 


第 五 草 


风 风 委 来 一 一 将 被 题 履 的 行业 


本 章 探讨 在 未 来 十 年 内 ， 人 工 智 能 将 给 哪些 商业 领域 融 来 翻 


天 和 窗 地 的 变化 。 有 了 第 三 章 对 机 器 学 习 基 本 原理 的 了 解 ， 束 能 深 
刻 体会 到 为 什么 机 套 学 习 将 造成 这 些 商 业 的 颠覆 。 但 即使 没 读 第 
三 草 也 完全 能 理解 本 草 。 


自动 芍 驶 颠覆 出 行 一 -10 万 亿美 元 的 产业 


人 工 智能 未 来 十 年 最 大 的 市 场 之 一 嗣 是 通过 目 动 当 驶 彻底 题 覆 汽 
车 的 制造 销售、 本 地 出 行 和 物流 行业 。 


目 动车 驶 传 感 融 


如 果 让 机 絮 开 车 ， 机 融 束 要 和 人 一 样 能 做 四 件 事 ， 第 一 ， 感 知 : 
离 车 100 米 处 是 一 辆 大 卡车 还 古 过 街 天 桥 。 第 二 ， 判 断 ， 马路 边 站 的 人 
征 有 要 抢 着 罕 行 还 是 在 等 我 的 车 过 去 。 第 三 ， 规 划 : 什么 时 机 挤 进 边 上 


的 车 流 中 去 。 第 四 ， 控 制 : 为 了 实现 规划 ， 如 何 控制 方向 盘 的 角度 和 
车 速 。 以 上 四 点 除了 控制 是 成 熟 技 术 以 外 ， 其 他 三 点 都 还 在 扔 点 上 。 
图 5.1 是 一 辆 目 动 芝 驶 汽车 的 感知 系统 。 


第 一 个 重要 的 传感器 就 是 摄像 头 。 摄 像 头 由 于 受到 像素 的 限制 ， 
只 能 看 清 前 面 几 十 米 ， 但 也 能 分 辨 不 同 的 物体 。 摄 像 头 还 能 够 做 到 其 
他 所 有 传感器 都 做 不 到 的 : 识别 交通 标志 。 摄 像 头 是 目前 最 成 熟 的 传 
感 器 ， 也 是 最 便宜 的 传感器 。 但 是 从 摄像 头 里 识别 物体 和 标志 并 不 容 
易 。 援 像 头 的 弱点 是 看 不 远 ， 尤 其 是 遇 到 十 、 雪 、 筋 者 天 气 时 ， 摄 像 
头 就 不 行 了 。 能 够 弥补 摄像 头 弱 点 的 另 一 个 传感器 是 毫米 波 雷 达 。 训 
米 波 雷达 可 以 看 清 200~300 米 甚至 更 远 的 距离 ， 不 受 日 光 和 天 气 影响 ， 
还 能 精确 测量 物体 的 距离 和 速度 。 但 现 有 的 毫米 波 雷 达 的 空间 分 辨 率 
很 低 ， 也 就 是 虽然 知道 200 米 处 有 一 个 物体 在 以 每 小 时 50 千 米 的 速度 移 
动 ， 但 弄 不 清 是 摩托 车 还 是 汽车 。 如 果 结 合 雷达 和 摄像 头 的 数据 ， 就 
可 以 更 准确 地 检测 和 跟踪 目标 。 当 一 个 物体 在 距离 200 米 处 时 ， 该 物体 
在 摄像 头 里 还 是 一 个 墨 点 ， 但 是 可 以 根据 相应 的 雷达 数据 获得 该 物体 
的 距离 和 移动 速度 。 等 物体 稍微 近 点 ， 摄 像 头 就 可 以 看 清 这 个 时 速 为 
50 于 米 的 物体 是 一 辆 摩托 车 。 摄 像 头 + 训 米 波 雷 达 是 半自动 和 自动 区 
驶 车 辆 最 基本 的 配置 〈 少 了 任何 一 个 都 不 行 ) ， 也 是 目前 (2018 年 ) 
特 斯 拉 所 有 车 型 的 标准 配置 。 


激光 雷达 旋转 
360° 检 测 车 辆 处 理 器 读 取 数据 
周围 物体 pr 并 调节 车 辆 行为 


雷达 测量 前 
方 车 辆 速度 


方向 传感器 ， 载 传 感 另 
跟踪 车 的 移 次 
动 和 平衡 决定 移动 距离 


图 5.1 自 动 驾 驶 汽车 所 需 的 传感器 


图 片 来 源 : https://insideevs.com/googles-self-driving-cars-ready-road-video/。 
传统 豪 米 波 雷 达 的 主要 问题 是 空间 分 辨 率 太 低 。 解 决 这 个 问题 有 


两 种 办 法 。 一 种 办 法 是 将 单一 天 线 变 成 一 组 天 线 (4 个 、8 个 、16 个 
等 ) ， 天 线 越 多 ， 多 个 天 线 合 成 的 空间 分 辨 率 就 越 高 ， 但 是 天 线 多 体 
积 也 随 之 变 大 ， 不 容易 安装 。 另 外 一 种 办 法 是 利用 汽车 移动 或 信号 变 
化 做 出 “虚拟 天 线 阵 列 *。 后 者 对 技术 要 求 很 高 ， 必 须 建立 在 对 雷达 成 
像 的 深度 理解 之 上 ， 并 且 需 要 许多 年 的 设计 经 验 。 美 国 的 Oculii 公 司 已 
经 研发 出 77GHz 的 高 分 辨 率 点 云 成 像 雷 达 。 图 5.2 束 是 这 个 雷达 产生 的 
点 云 数据 ， 已 经 和 市 面 上 的 中 低 精 度 激 光 雷 达 可 比 。 如 果 毫 米 波 雷达 
能 够 达到 高 分 辨 率 ， 一 辆 自动 芍 驶 汽车 只 要 摄像 头 和 党 米 波 雷达 就 足 
够 了 。 


图 5.2 美 国 毫米 波 雷 达 公 司 Oculii 成 像 雷 达 产 生 的 周围 环境 点 云图 
图 片 来 源 : 美国 Oculii 公 司 。 

在 自动 区 驶 行业 里 ， 许 多 人 认为 全 目 动 概 驶 汽车 必须 精确 知道 周 
围 环境 里 的 物体 和 距离 。 激 光 雷 达 是 许多 厂商 都 在 试验 的 精准 传 感 
器 。 激 光 雷 达 在 本 质 上 就 是 一 个 三 维 照相 机 。 三 维 相片 上 的 每 一 个 物 
体 、 每 一 个 像素 的 距离 都 能 精确 到 厘米 级 。 这 种 三 维 照 片 的 像素 集合 
也 被 称 为 “< 点 云 "。 图 5.3 束 是 斯 坦 福 大 学 标 榈 大 道 的 激光 雷达 三 维 点 
云 。 这 张 图 上 有 每 一 个 点 到 测量 激光 雷达 的 距离 。 


激光 雷达 晚上 的 效果 比 日 天 还 好 ， 因 为 没有 阳光 的 干扰 。 但 与 摄 
像 头 类 似 ， 它 的 问题 是 当 遇 到 雨 雪 务 疆 天 气 时 罕 透 距离 会 大 大 下 降 。 
另外 一 个 问题 是 到 目前 为 止 它 的 成 本 仍然 很 高 。 目 前 市 场 上 唯一 在 销 
售 的 Velodyne 128 线 激光 雷达 〈 垂 直 空 间 分 辨 率 只 有 128 线 ， 电 视 机 是 1 
024 线 ， 这 已 经 是 目前 在 售 激光 雷达 的 最 高 分 辨 率 ) 的 零售 价格 为 7 万 
~8 万 美元 一 台 〈 一 个 毫米 波 雷 达 价格 不 到 500 美 元 ) ， 相 当 于 两 三 辆 中 
档 汽车 的 价格 。 很 显然 ， 这 种 价格 只 能 用 于 少量 的 测试 车 辆 。 许 多 三 
商都 在 努力 降低 成 本 ， 目 前 世界 上 有 60 多 家 企业 在 人 研制 激光 雷达 ， 它 
们 的 技术 路 线 大 致 分 为 三 类 。 
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图 5.3 高 分 辩 率 激光 雷达 点 云 


图 片 来 源 : https://techcrunch.com/2018/04/12/luminar-puts-its-lidar-tech-into-productionthrough- 
acquisitions-and-smart-engineering/ ° 


1. 机 械 扫描 式 激 光 雷 达 
我 们 看 到 的 谷歌 和 百度 目 动 芍 驶 车 辆 头顶 上 项 的 “化 盆 ? 融 是 机 械 
扫描 式 激 区 雷达 ， 这 也 是 目前 市 面 上 少数 儿 种 可 用 的 激光 雷达 。 


图 5.4 是 美国 Velodyne 公 司 的 三 种 激光 雷达 ， 从 左 至 右 分 别 为 64 
线 、32 线 和 16 线 。 
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图 5.4 美 国 Velodyne 公 司 的 激光 雷达 产品 
图 片 来 源 : http://velodynelidar.com/products.html °。 

64 线 激光 雷达 里 面 有 64 对 垂直 排列 的 激光 发 射 管 和 光学 接收 器 。 
整个 激光 雷达 在 水 平方 向 上 做 360° 旋 转 。 在 旋转 时 ，64 个 发 射 管 按照 
一 定 的 顺序 依次 发 射 短 激光 脉冲 ， 激 区 脉冲 从 远 处 物体 反射 回来 后 被 
相应 发 射 管 的 光学 接收 器 收 到 ， 此 时 该 物体 的 距离 =c x 了 ， 这 里 c 是 光 
速 ，I 是 脉冲 往返 时 间 。 如 果 这 部 64 线 激光 雷达 每 秒 转 20 圈 ， 每 水 平 
角度 整个 64 线 激光 发 射 三 次 〈 角 度 分 辨 率 为 3 度 ) ， 每 秒 就 会 产生 
20x3x360x64=1 382 400 点 数据 。 把 这 些 带 有 距离 和 方位 的 三 维 空间 点 
全 部 男 出 来 束 是 如 图 5.3 所 示 的 “点 云 "。 这 种 机 械 扫描 式 油 光 雷 达 有 两 
个 缺点 : 第 一 征 机 械 容易 损坏 ， 特 别 是 车 载 、 震 动 、 高 温 、 淹 淫 等 对 
机 械 部 分 危害 很 大 。 第 二 古装 配 时 需要 很 多 手工 调试 ， 成 本 很 高 。 许 
多 公司 在 人 研发 时 不 用 或 少 用 机 械 部 件 。 完 全 没有 机 械 部 件 的 油光 雷达 
也 叫 固态 激光 雷达 。 


2. 固 态 激 光 雷 达 


固态 油光 雷达 有 两 种 做 法 ， 一 种 做 法 是 通过 控制 不 同 的 几 束 激光 
相位 (“相位 ”即时 间 延 迟 ) 让 它们 形成 一 束 聚 焦 的 激光 在 空间 扫描 ; 
男 一 种 做 法 是 用 激光 发 冉 器 点 隆 。 前 者 技术 复杂 ， 控 制 激 光 相 位 对 瘟 
度 敏感 ， 在 汽车 行驶 环境 极端 的 情况 下 ， 激 光 雷 达 性 能 不 容易 稳定 。 
后 者 需要 大 量 激光 发 射 左 ， 例 如 一 个 100x100 的 点 阵 殉 需要 10 000 个 激 
光 发 姻 管 。 固 态 激光 雷达 还 有 一 个 问题 是 只 能 照射 一 个 方向 ， 所 以 在 
一 辆 车 上 要 看 到 全 方位 的 情况 ， 至 少 要 4 个 激光 雷达 分 别 朔 在 车 的 四 个 
首长 

固态 油光 雷达 中 还 有 一 种 "内 光 激 光 雷 达 ”， 它 的 原理 和 闪光 灯 照 
相 类 似 。 只 用 一 个 激光 管 ， 发 射出 一 个 脉冲 面 光 源 把 前 方 一 大 片 空 间 
都 照 亮 ， 接 收 器 类似 数 子 相机 里 面 的 感光 阵列 已 片 ， 只 不 过 这 种 芯片 
在 像素 感光 的 同时 ， 可 以 记录 每 一 个 像素 收 到 脉冲 的 时 间 ， 因 此 能 测 
出 这 个 像素 对 应 的 空间 点 的 距离 。 这 种 内 光 激 区 雷达 成 本 最 低 ， 但 是 
由 于 发 射 能 量 分 散 ， 所 以 要 照 亮 一 大 片 ， 成 像 距 离 很 短 (十 几米 到 几 
二 


3. 微 机 械 扫 描 激 光 雷 达 


介 于 机 械 扫 摘 式 激 光 雷 达 和 固态 油光 雷达 之 间 的 是 一 种 微机 械 扫 
描 激 光 雷 达 。 这 种 激光 雷达 是 用 半导体 芯片 上 的 微机 电器 件 (Micro- 
Electronic-Mechanical-System，MEMS) 。 微 机 电器 件 的 原理 是 在 半 导 
体 材料 上 刻 蚀 出 微小 的 机 械 镜 面 ， 用 电 可 以 控制 镜面 的 摆动 。 把 激光 
射 到 镜面 上 ， 当 镜面 摆动 时 瓯 可 以 扫描 一 定 的 空间 范围 。 图 5.5 残 是 
MEMS 镜 面 的 示意 图 。 但 这 种 镜面 的 转动 角度 有 限 ， 所 以 激光 雷达 前 
方 能 照射 的 角度 仍然 受 限 。 


图 5.5 在 半导体 材料 上 刻 蚀 出 来 的 微机 电镜 面 放大 图 
图 片 来 源 : http://www.preciseley.com/technology.html 。 


目前 还 没有 一 种 激光 雷达 既 能 够 达到 距离 足够 远 (200~300 米 ) ， 
同时 分 辩 率 和 可 靠 性 也 足够 高 ， 而 且 价 格 便 宜 ( 几 百 美元 ) 。 如 果 毫 
米 波 雷达 可 以 在 远 距 离 达到 足够 高 的 分 辨 率 ， 那 么 激光 雷达 只 要 用 于 
近 距 离 精确 测量 即 可 ， 这 样 成 本 最 低 ， 没 有 任何 机 械 部 件 的 内 光 式 激 
光 雷 达 将 足以 甫 用 。 

除了 摄像 头 、 至 米 波 雷达 和 激光 雷达 这 三 个 传 感 硕 之 外 ， 几 乎 所 
有 半 目 动 和 目 动 当 驶 的 车 都 用 声响。 声呐 能 探测 的 距离 很 近 ， 只 有 几 
米 ， 主 要 用 于 堡 车、 倒车 时 的 防 撞 提醒 。 一 个 车 用 声呐 只 要 几 美 元 ， 
一 辆 车 会 治 着 底盘 放 十 几 个 声呐 。 

全 上 自动 敬 驶 还 要 使 用 GPS (全 球 定位 系统 ) 。 通 常 手机 和 车 里 用 
于 地 图 的 GPS 的 精度 在 15 米 左右 。 这 样 的 精度 做 自动 芍 驶 和 防 撞 都 不 
> 所 以 用 于 目 动 区 驶 的 GPS 十 可 以 做 到 10 厘 米 高 精度 的 “ 老 分 GPS”。 

差分 GPS 系统 在 地 面 设 一 些 固 定 的 校准 基站 〈 不 需要 像 移 动 电话 基站 
那么 密集 每 隔 几 十 千 米 甚至 几 百 千 米 一 个 即 可 ) 。 这 些 点 的 精确 从 
标 已 知 。 把 这 些 点 上 用 普通 GPS 测 量 出 的 坐标 和 已 知 坐标 相 比 较 束 会 
知道 GPS 的 误差 ， 把 这 个 误差 通过 无 线 频 道 (例如 手机 信号 ) 传 给 附 
近 的 GPS 接 收 机 ， 让 大 家 都 修 正 这 个 误 蕾 。 0 
以 让 汽车 知道 目 己 在 哪 条 线 道上 ， 是 否 偏 离 了 线 道 的 中 心 。 差 分 GPS 


过 去 主要 用 于 航空 和 测量 ， 每 台 差 分 GPS 的 价格 高 达 几 万 美元 。 目 前 
也 有 硅谷 创业 公司 如 Polynesian Exploration 等 在 研发 用 于 目 动 芍 驶 的 低 
成 本 差分 GPS。 


目 动车 驶 分 级 


此 前 ， 自 动 鸭 驶 的 自动 化 程度 分 级 有 两 个 标准 。 美 国 交 通 部 下 辖 
的 美国 国家 公路 交通 安全 管理 局 (NHTSA) 在 2013 年 率先 发 布 了 自动 
当 驶 汽车 的 分 级 标准 ， 其 对 目 动 化 的 描述 共有 4 个 级 别 。 到 2014 年 ， 世 
界 汽车 工程 师 协 会 (SAE) 也 推出 了 一 套 自 动 芍 驶 汽车 分 级 标准 ， 其 
对 自动 化 的 描述 分 为 5 个 等 级 。2016 年 9 月 20 日 ， 美 国 交 通 部 发 布 的 针 
对 目 动 敬 驶 汽车 的 自 项 联邦 指导 方针 中 放弃 了 NHTSA 之 前 提出 的 分 级 
标准 ， 宣 布 将 采用 在 世界 范围 应 用 更 加 广泛 的 SAE 分 级 标准 ， 这 代表 
SAE 的 5 级 标准 基本 成 为 行业 共识 。 目 动 芝 驶 根据 目 动 程度 目前 被 分 为 
以 下 5 个 级 别 。 

L1: 敬 驶 辅助 ， 对 方 同 盘 和 加 减速 中 的 一 项 操作 提供 驾驶 支持 ， 
例如 目 动 巡航 、 紧 急 目 动 刹 车 等 。 其 他 的 区 驱动 作 都 由 人 类 芍 驶 员 进 
行 操 作 。 在 这 个 阶段 ， 汽 车 主要 实现 了 一 些 预警 类 功能 ， 当 汽车 遇 到 
紧急 情况 时 ， 汽 车 发 出 警告 信和 号， 例如 车 道 偏离 预警 、 磁 撞 预 警 、 肝 
点 监测 等 。 目 前 这 些 功 能 已 经 被 广泛 应 用 到 现在 的 汽车 上 。 


L2: 部 分 目 动 化 ， 通 过 区 驶 环境 对 方向 盘 和 加 减速 中 的 多 项 操作 
提供 要 驶 文 持 ， 其 他 的 要 驶 动作 都 由 人 类 轨 驶 员 进行 操作 。 在 该 阶 
段 ， 汽 车 已 经 具备 一 些 目 主 决策 和 执行 的 能 力 ， 例 如 目 适应 巡航 、 节 
道 线 保持 、 紧 急 刹 车 、 目 动 汝 车 等 。 目 前 特 斯 拉 的 “AutoPilot” 辅 助 区 
驶 系统 束 达 到 了 L2 级 别 。 

L3: 有 条 件 目 动 化 ， 由 目 动 要 驶 系统 完成 所 有 的 雪 驶 操作 。 根 据 
系统 要 求 ， 人 类 当 驶 员 提供 恰当 的 应 答 。 主 要 实现 的 功能 为 目 动 加 


速 、 目 动 刹车 、 目 动 转 向 、 编 队 行 驶 、 汇 入 车 流 、 主 动 避 障 等 。 在 L2 
的 基础 上 增加 识别 交通 标志 、 红 绿灯 、 目 动 转 要 ， 可 以 判断 简单 的 交 
通 浣 争 状况 〈 例 如 两 辆 车 同时 到 达 十 字 路 口 停车 线 ) 等 功能 。 芍 驶 员 
无 须 一 直 监 视 行驶 ， 但 复杂 情况 仍 需 准 备 接管 。 

L4: 高 度 目 动 化 ， 由 目 动 芍 驶 系统 完成 所 有 的 要 驶 操作 。 根 据 系 
统 要 求 ， 人 类 要 驶 员 不 一 定 需要 对 所 有 的 系统 请 求 做 出 应 答 ， 也 不 限 
定 道路 和 环境 条 件 等 ， 除 了 符 定 的 天 气 和 路 段 ， 汽 车 在 大 多 数 场景 下 
能 够 目 动 芍 驶 。 

L5: 完全 目 动 化 ,在 所 有 人 类 敬 驶 员 可 以 应 付 的 道路 和 环境 条 件 
下 ， 均 可 以 由 目 动 营 驶 系统 上 自主 完成 所 有 的 驾驶 操作 。 和 车辆 在 全 天 
候 、 全 场景 下 都 能 够 实现 自动 区 驶 ， 无 有 顷 人 的 介入 。 


读者 可 能 发 现 上 面 的 定义 有 很 多 模糊 之 处 ， 各 层级 的 功能 似乎 也 
有 很 多 重 谷 ， 笔 者 在 这 里 尝试 给 出 一 个 更 为 简单 清晰 的 定义 。 

L1: 人 全 程 人 负责 芝 驶 ， 有 某 个 单项 的 机 器 目 主 功能 ， 例 如 目 动 紧 
急 刹 车 。 


L2: 仍然 是 人 全 程 负 责 芍 驶 ， 但 在 限定 条 件 下 可 以 由 机 器 芍 驶 几 
十 秒 到 几 分 钟 (例如 在 线 道 清晰 的 高 速 公路 上 萄 驶 员 手 离开 方向 盘 ， 
眼睛 不 看 路 ， 脚 不 放 在 刹车 上 的 时 间 不 超过 几 分 钟 )。 有 多 项 机 器 自 
主 功能 同时 使 用 ， 例 如 目 动 巡航 和 线 道 保持 同时 用 ， 营 驶 体验 比 L1 轻 


松 很 多 。 

L3: 到 和 独 过 程 可 以 明确 分 为 两 种 不 同 的 时 间 段 :， 人 负责 营 驶 的 时 
间 段 和 机 严 负 责 的 时 间 段 。 当 机 亏 负 贡 轨 驶 时 ， 人 可 以 手 离开 方 同 
盘 ， 有 眼睛 不 看 路 ， 脚 离开 刹车 。 当 过 到 情况 时 ， 机 絮 会 请 求 其 至 强制 
人 接管 要 驶 。 目 前 市 场 上 还 没有 任何 一 个 量 产 的 L3 乘 用 车 。 

L4: 机 器 驾驶 时 间 达 到 95% 以 上 ， 但 仍然 不 时 有 特殊 情况 需要 人 


管 。 


烧 


L5: 机 天 区 狐 时 间 100%。 即 车 里 不 再 需要 方 问 盘 、 章 车 、 油 门 


4 
于 


自动 芍 驶 上 分 为 两 大 技术 流派 :演进 派 和 激进 派 。 演 进 派 认 为 目 
动 芍 驶 不 可 能 一 践 而 就 ， 必 须 一 步 一 步 循序 渐进 。 演 进 派 寺 括 了 所 有 
的 汽车 制造 商 ， 包 括 新 进入 的 “互联 网 造 车 ”或 “新 势力 造 车 ”厂商 。 原 
因 很 简单 ， 它 们 每 年 都 要 造 和 卖 大量 的 车 ， 只 能 是 什么 技术 成 熟 就 安 
闭 什 么 技术 。 和 截至 2018 年 ， 只 有 少数 在 售 的 汽车 有 L2 功 能 ， 例 如 特 斯 
拉 、Audi A8 和 奔驰 公司 E 级 车 型 等 。 目 前 全 世界 几乎 所 有 的 大 汽车 厂 
商 和 一 级 供应 商都 在 紧张 研究 自动 构 驶 ， 但 它们 打算 推出 的 未 来 新 车 
主要 集中 在 L2 或 L3 级 别 。 

激进 派 的 代表 是 谷歌 的 自动 芍 驶 公司 Waymo， 合 歌 的 实验 车 根本 
没有 方向 盘 。 这 一 派 认为 L2 和 L3 很 危险 ， 什 么 时 候 该 人 管 ， 什 么 时 候 
该 机 器 管 不 仅 很 难 分 清 ， 而 且 两 者 之 间 的 切换 也 会 产生 问题 (例如 人 
打上 师 儿 睡 着 了 叫 不 醒 ) ， 一 步 到 位 全 让 机 器 开车 反而 安全 。 全 自动 流 
派 因 为 目前 并 不 造 车 卖 车 ， 所 以 它们 只 对 未 来 感 兴 趣 。 男 一 个 重要 原 
因 是 它们 要 想 颠 履行 业 ， 就 必须 做 目前 车 三 做 不 了 的 。 


演进 派 的 优势 是 它们 的 车 不 断 地 给 用 户 提供 新 的 功能 和 价值 ， 一 
直 从 技术 上 获 益 。 演 进 派 的 风险 是 如 采油 进 派 的 全 目 动 营 驶 成 功 了 ， 
将 会 题 履 整个 行业 。 所 以 演进 派 ， 竺 别 征 一 流 大 车 广 都 同时 在 做 全 目 
动 当 驶 的 研究 。 激 进 派 的 优势 是 专注 于 全 目 动 ， 它 们 成 功 会 比 演进 派 
早 ， 一旦 成 功 束 会 让 演进 派 无 路 可 走 。 激 进 派 的 风险 是 如 琳 实 现 全 目 
动 很 困难 ， 它 们 就 会 长 期 投入 而 没有 收入 ， 时 间 太 长 哪 家 公司 都 打 不 
I 


L4 和 L5 全 目 动 芝 驶 又 有 两 条 不 同 的 技术 路 线 ， 一 条 是 基于 高 精度 
地 图 和 精准 定位 ， 男 一 条 是 无 须 高 精度 地 图 。 基 于 高 精度 地 图 需要 两 
个 条 件 : 第 一 是 所 要 驶 区 域 已 经 有 测量 好 的 高 精度 地 图 ;第 二 是 车 上 
有 能 精准 测 距 或 定位 的 仪 医 ， 例 如 激光 雷达 和 兰 分 GPS。 做 到 第 一 点 
需要 有 大 量 的 高 精度 地 图 测量 车 把 一 个 国家 内 的 所 有 行驶 道路 测量 出 


来 。 这 种 测量 通常 也 是 使 用 激光 雷达 加 上 差分 GPS。 但 测量 时 车 的 行 
驶 速度 不 能 太 快 ， 大 约 为 时 速 50 千 米 ， 因 为 行驶 速度 会 影响 测量 精 
度 。 有 人 估计 如 果 只 用 一 辆 测量 车 把 全 美国 的 高 精度 地 图 都 测量 完毕 
需要 6 000 年 的 时 间 (或 者 600 辆 车 用 十 年 时 间 ) 。 由 于 地 图 的 精度 
高 ， 数 据 量 很 大 ， 所 以 汽车 里 只 能 存储 一 部 分 地 图 。 当 汽车 驶 出 车 内 
存储 的 地 图 范围 时 ， 需 要 有 很 宽 的 无 线 传 输 带 宽 不 断 将 新 区 域 的 高 精 
度 地 图 传 给 汽车 。 依 赖 高 精度 地 图 还 有 一 个 巨大 的 挑战 是 路 况 和 路 障 
的 实时 更 新 。 这 种 实时 更 新 只 能 靠 “ 众 包 ” 的 方式 ， 即 靠 正在 路 上 行驶 
的 汽车 收集 并 实时 上 传 到 云端 ， 且 实时 下 载 到 路 障 附近 的 车 里 。 这 束 
出 现 了 一 个 先 有 鸡 还 是 和 有 有 蛋 的 问题 : 一 开始 没有 几 辆 车 有 实时 数据 
收集 的 能 力 ， 这 样 束 没 人 敢 用 自动 要 驶 ， 没 人 敢 用 就 没有 数据 收集 。 

第 二 种 自动 区 驶 的 技术 路 线 不 依赖 于 高 精度 地 图 。 这 里 的 逻辑 是 
人 的 眼睛 不 能 精确 测量 周围 物体 的 距离 ， 为 什么 非 要 每 一 点 像素 的 距 
离 ” 有 一 个 大 概 即 可 。 这 种 方案 的 最 大 优势 是 不 依赖 于 不 知道 什么 时 
候 才 能 有 的 高 精度 地 图 ， 成 本 很 低 。 但 坚持 高 精度 地 图 技术 路 线 的 人 
批评 说 ， 高 精度 地 图 方案 可 以 保证 99.9999% 的 安全 性 ， 而 没有 高 精度 
地 图 也 许 只 能 保证 99% 的 安全 性 。 但 即使 是 1% 的 错误 也 是 致命 的 。 

有 了 之 前 介绍 的 那些 传感器 汽车 承 相 当 于 有 了 眼睛。 但 是 人 类 视 
觉 不 光 是 眼睛 ， 还 包括 脑 神 经 对 接收 信号 的 识别 和 判断 。 目 动 要 驶 软 
件 的 核心 就 是 识别 和 判断 。 一 辆 车 的 传感器 有 很 多 ， 第 一 个 挑战 是 要 
把 这 些 传感器 传 进来 的 信号 融合 起 来 。 融 合 的 主要 任务 是 要 把 不 同 传 
感 妖 探测 到 的 物体 一 一 对 应 起 来 。 例 如 片 米 波 雷 达 发 现 了 一 个 物体 ， 
要 在 摄像 头 的 视频 中 把 这 个 物体 找 出 来 。 当 各 个 传感器 探测 到 的 物体 
很 多 ， 勾 要 在 极 短 的 时 间 里 把 所 有 物体 都 识别 并 对 应 起 来 时 ， 融 合 就 
变 得 不 那么 简单 了 。 

和 目 动 要 驶 软件 的 第 二 个 挑战 是 要 处 理 大 量 的 数据 。 我 们 前 面 算 
过 ， 一 个 64 线 激光 雷达 每 秒 钟 产生 130 万 个 三 维 数据 点 。 我 们 假设 使 用 
神经 网 络 来 识别 物体 ， 需 要 处 理 能 力 非 常 强 大 的 芯片。 目前 在 自动 区 


驶 上 使 用 的 英 伟 达 Xavier 必 片 (2016 年 9 月 发 布 ) 的 处 理 能 力 是 每 秒 20 
万 亿 次 运算 ， 功 耗 为 20 瓦 。 

目 动车 驶 软件 的 第 三 个 挑战 ， 也 即 运 今 最 大 的 挑战 是 如 何 识别 和 
判断 各 种 复杂 情况 。 如 果 单 纯 使 用 机 需 学 习 的 方法 ， 需 要 训练 的 情形 
几乎 无 穷 多 ， 不 仅 无 法 收集 到 这 么 多 数据 ， 而 且 计算 量 怀 人 或 计算 成 
本 是 天 文 数 字 。 目 前 的 目 动 当 驶 软件 大 部 分 都 是 袖 合 式 的 ， 即 简单 的 
和 常见 的 情形 用 基于 规则 的 判断 ， 例 如 线 道 保持 、 目 动 停 车 、 尊 守 交 
通 规则 等 (目前 特 斯 拉 L2 功 能 主要 是 基于 规则 的 判断 ) 。 非 常见 的 情 
形 可 以 用 机 器 学 习 。 


目 动车 驶 软件 的 第 四 个 挑战 是 如 何不 断 地 学 习 。 目 前 古 将 车 里 采 
集 的 数据 上 传 到 云 里 ， 在 云端 进行 训练 。 我 们 前 面 的 算法 部 分 近 到 
过 ， 目 前 的 机 妖 学 习 一 旦 有 了 新 数据 ， 束 要 把 新 老 数 据 放 在 一 起 重新 
训练 神经 网 络 ， 只 用 新 数据 来 改进 原 有 模型 的 “ 增 量 * 训 练 方法 还 在 人 研 
完 阶 段 。 这 样 靳 的 模型 殉 要 经 过 大 量 测试 以 确保 万 无 一 失 。 

目 动 车 驶 软件 的 第 五 个 挑战 是 如 何 个 性 化 。 目 前 的 区 驶 算法 在 所 
有 车 上 都 是 一 样 的 ， 和 很 多 人 的 要 驶 习惯 不 同 。 但 个 性 化 的 芝 驶 算法 
需要 每 一 辆 车 的 模型 都 不 同 ， 个 性 化 驾驶 不 仅 需 要 大 量 的 路 况 数据 ， 
还 需要 每 个 人 的 区 驶 习惯 数据 。 但 一 个 人 能 遇 到 的 状况 有 限 ， 为 了 证 
汽车 足够 聪明 ， 需 要 许多 人 的 路 况 和 区 驶 数据 ， 如 何 能 够 学 到 其 他 人 
的 营 驶 经 验 同时 义 符 合 目 己 的 营 驶 习惯 是 一 个 两 难 问题 。 

目 动车 驶 软件 的 第 六 个 挑战 是 如 何 学 习 和 道路 上 的 车 辆 博 型 。 人 
们 日 闻 雪 驶 并 不 总 是 疡 格 遵守 交通 规则 ， 许 多 情况 交规 里 面 也 没有 规 
定 。 在 世界 上 的 许多 地 方 ， 如 果 严 格 遵守 交通 规则 要 驶 ， 那 么 汽车 可 
能 寸步 难 行 ， 此 时 要 狐 软 件 该 如 何 办 ? 一 种 可 行 的 方法 就 十“ 随 大 
流 ”， 这 束 要 求 机 需 能 学 习 各 地 的 “ 芍 驶 文化 ”。 这 种 博 奔 学 习 同 样 需要 
模型 有 “连续 学 习 ” 和 “ 增 量 学 习 ” 的 能 力 。 

一 套 目 动 芍 驶 软件 大 人 致 由 下 列 几 个 模块 组 成 。 


(1) 感知 和 数据 融合 。 
(2) 物体 检测 、 分 类 、 跟 踪 。 
(3) 场景 识别 和 判断 。 
(4) 路 径 规划 。 

(5) 控制 (方向 、 速 度 、 刹 车 等 ) 。 


电动 车 和 目 动 区 驶 


和 自动 芍 驶 几乎 同步 成 为 未 来 趋势 的 是 电池 动力 汽车 。 电 动车 的 
控制 反应 时 间 (加 速 减速 等 ) 比 汽油 车 要 短 得 多 。 例 如 汽油 发 动机 把 
油门 断 掉 ， 喷 入 汽缸 的 汽油 还 会 继续 燃烧 一 小 段 时 间 ， 而 电动 车 马达 
一 断 电 马上 就 没有 动力 。 电 动 化 也 能 更 好 地 支撑 自动 化 程度 的 不 断 提 
高 。 汽 车 自动 化 过 程 需要 识别 、 接 收 和 处 理 大量 复杂 的 信息 ， 不 仅 需 
要 数量 庞大 的 传感器 、 控 制 器 、 世 片 等 硬件 支撑 ， 同 时 也 需要 实时 对 
数据 进行 传输 、 存 储 和 计算 。 这 一 系列 复杂 的 过 程 需要 足够 多 的 电能 
作为 支撑 。 电 子 产 品 配置 增多 ， 耗 电量 越 大 ， 需 要 的 电池 容量 越 大 。 
电动 化 和 自动 化 这 两 者 结合 的 典型 代表 就 是 特 斯 拉 的 具有 辅助 驾驶 功 
能 的 S 型 轿车 和 X 型 SUV (运动 型 实用 汽车 ) 。 

电动 汽车 曾经 面临 的 第 一 个 问题 是 巡航 里 程 数 。 美 国 87% 的 汽车 
每 天 驾驶 距离 不 会 超过 117 千 米 ，2017 年 美国 最 便宜 的 电动 车 巡航 里 程 
已 经 达到 200 千 米 。 电 动车 巡航 里 程 已 经 能 够 完全 满足 绝 大 部 分 人 日 常 
本 地 活动 和 上 下 班 的 需求 , “电池 焦虑 ”问题 已 经 大 大 缓解 。 特 斯 拉 S 型 
轿车 的 最 高 巡航 里 程 已 经 达到 每 次 充电 行驶 500 千 米 。 过 去 锂电 池 技 术 
的 发 展 是 每 十 年 容量 翻番 ， 也 就 是 说 ， 在 没有 大 的 技术 突破 的 情况 
下 ,十 年 后 同等 体积 或 重量 的 电池 可 以 达到 每 次 充电 行驶 1 000 千 米 。 


目前 汽车 电池 的 最 大 问题 是 充电 时 间 。 特 斯 拉 的 “超级 充电 桩 ” 代 
表 目 前 大 规模 商用 电动 汽车 中 最 快 的 充电 时 间 ， 从 零 到 充满 需要 75~90 
分 钟 (根据 电池 容量 大 小 ) ， 这 成 为 目前 电动 车 无 法 出 远门 的 主要 障 
碍 。 只 有 把 充电 时 间 缩 短 到 和 汽油 车 加 油 时 间 可 比 (5~10 分 钟 ， 才 能 
彻底 解决 出 远门 的 问题 。 目 前 美国 和 以 色 列 都 有 创业 公司 在 研发 快速 
充电 电池 和 材料 ， 如 硅谷 的 新 创 公 司 Gru Energy Lab 等 。 


电动 汽车 的 第 二 个 问题 是 电池 成 本 。2018 年 锂电 池 的 成 本 约 为 200 
美元 /千瓦 时 ， 一 辆 能 够 巡航 约 338 千 米 的 特 斯 拉 S-60 型 电池 成 本 约 为 
200x60=12 000 美 元 ， 电 池 成 本 约 占 整 个 车 的 115。 所 以 同等 档次 的 电 
动车 要 比 汽油 车 出 广 价格 贵 。 但 在 罗 驶 过 程 中 由 于 充电 费用 是 汽油 的 
1/3， 所 以 这 个 出 厂 成 本 差额 可 以 在 汽车 整个 寿命 期 间 内 补 平 。 舍 如 图 
5.6 所 示 ， 预 计 锂 电池 的 成 本 在 2020 年 会 降 到 100 美 元 /千瓦 时 ， 这 时 一 
辆 电动 汽车 的 成 本 就 将 相当 于 一 部 同 档次 的 汽油 车 成 本 (因为 电动 车 
除了 电池 这 个 额外 成 本 ， 其 他 成 本 和 汽油 车 相 比 大 幅 下 降 ， 比 如 没有 
汽油 发 动机 和 变速 箱 等 ， 电 子 控制 也 更 简单 ) 。 这 个 时 点 将 成 为 电动 
车 的 爆发 点 ， 因 为 行驶 寿命 期 间 节 约 的 油 费 将 成 为 用 户 的 净 收 益 。 如 
果 今 后 十 年 电池 成 本 继续 按 这 个 速度 下 降 ， 十 年 后 电池 成 本 只 占 到 整 
车 成 本 的 150， 几 乎 可 以 忽略 不 计 。 电 池 成 本 的 下 降 也 意味 着 巡航 里 
程 数 的 增加 ， 当 电池 只 占 到 整 车 成 本 的 1/50 时 ， 用 户 可 以 选择 增加 1/50 
的 成 本 来 增加 巡航 里 程 。 


电池 成 本 在 电动 车 部 件 中 排名 第 三 位 
电池 成 本 持续 下 降 ， 将 驱动 电动 车 需求 的 不 断 上 升 
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图 5.6 锂 电池 成 本 下 降 趋 势 和 电动 车 对 电池 的 全 球 需 求 量 趋势 

图 片 来 源 : 彭 博 社 。 

即使 没有 自动 萄 驶 技术 ， 由 于 动力 电池 的 容量 增加 和 成 本 下 降 ， 
整个 汽车 行业 也 会 加 电动 汽 车 大 规模 转型 。 但 电池 驱动 技术 将 使 汽车 
行业 的 新 进入 者 的 进入 门槛 大 大 降低 。 所 以 几乎 新 进入 者 全 部 是 造 电 
池 动 力 车 ， 而 且 新 进入 者 几乎 都 是 互联 网 厂商 ， 例 如 谷歌 、 百 度 或 者 
电子 设备 厂商 苹果 、 华 为 等 。 相 比 于 传统 汽车 厂商 ， 在 传动 系统 上 ， 
电池 动力 几乎 让 新 进入 者 与 传统 厂商 处 在 同一 条 起 跑 线 上 ， 在 自动 区 
驶 技术 上 新 进入 者 往往 更 有 优势 。 

如 图 5.7 所 示 ， 一 辆 巡航 里 程 322 千 米 的 电动 车 成 本 在 2017 年 已 经 
低 于 一 辆 美国 汽油 车 的 均 价 ， 将 在 2030 年 左右 低 于 美国 新 车 的 最 低 价 
格 。 与 此 同时 ， 电 动车 销量 每 年 增长 达 30% 以 上 ， 全 球 保有 量 在 2033 
年 左右 将 超过 1 亿 辆 。 
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图 5.7 巡 航 322 千 米 的 电动 车 成 本 下 降 趋势 


片 来 源 : https://www.nextbigfuture.com/2016/04/by-2030-electric-vehicles-with-200-mile. 
html ° 


特 斯 拉 电 动车 证 明了 电动 车 未 来 的 巨大 商业 前 景 后 ， 几 乎 所 有 的 
主流 厂商 ， 包 括 过 去 认为 电动 车 不 可 能 成 功 的 厂商 都 大 幅 调 高 未 来 电 
动车 的 占 比 ， 开 始 研发 电动 车 新 型 号 。 仅 德国 大 众 一 家 厂商 就 宣布 到 
2025 年 生产 300 万 辆 多 达 30 个 不 同型 号 的 新 电动 车 。 中 国政 府 出 台 政 策 
要 求 电动 车 占 比 从 2017 年 的 8% 上 升 到 2020 年 的 12%。 如 果 2025 年 全 世 
界 电动 车 占 比 达到 25%， 共 需要 1 500 千 兆 瓦 时 (GigaWatt-Hour) 的 电 
池 ， 这 相当 于 要 建 40 个 目前 世界 最 大 的 在 内 华 达州 的 特 斯 拉 电 池上 广 。 
按照 届时 100 美 元 /千瓦 时 计算 ， 光 汽车 所 需 电 池 行 业 每 年 的 产值 就 达 1 
500 亿 美元 。 如 果 加 上 储 能 、 换 电池 等 需求 ， 动 力 电 池 行 业 届 时 将 轻易 
成 为 一 个 数 千 亿 美元 的 产业 。 电 动车 对 电池 有 如 此 巨大 的 需求 ， 任 何 
电池 技术 的 突破 都 将 具有 巨大 的 商业 价值 。 


电动 汽车 本 身 将 形成 一 个 新 的 生态 系统 。 除 了 电池 (以 及 电池 行 
业 的 子 生态 包括 电池 正 负极 材料 、 隔 膜 、 生 产 设备 、 原 料 矿石 、 电 池 
组 管理 软 硬 件 等 ) ， 另 一 个 巨大 的 商业 机 会 是 充电 桩 和 充电 站 。 当 电 
动 汽车 保有 量 超过 汽车 的 10% 时 ， 融 将 需要 大 量 的 充电 桩 和 换 电 池 
站 。 目 前 每 个 充电 桩 设备 安 儿 成 本 大 约 为 5 000 美 元 。 当 世界 电动 汽车 
保有 量 达 一 亿 辆 时 ， 届 时 至 少 需要 100 万 个 公共 充电 桩 。 充 电 速度 仍然 
征 电 动车 长 途 出 行 的 一 个 最 大 障碍 。 目 前 的 技术 进展 完全 有 可 能 在 未 
来 五 年 内 将 300 千 米 巡 航 充 电 时 间 缩 短 到 10 分 钟 之 内 。 各 种 高 速 充 电 设 
备 也 将 是 一 个 巨大 的 市 场 。 届 时 大 量 的 汽车 在 高 峰 时 间 高 速 充 电 将 对 
电网 造成 不 可 承受 的 负 谷 。 电 网 的 改造 和 储 能 设备 的 商机 也 将 应 运 而 
生 。 除 此 之 外 ， 电 动 汽车 的 核心 部 件 之 一 是 高 速 、 高 扭矩 马达 。 谁 能 
率先 研发 出 低 成 本 高 性 能 的 马达 ， 谁 将 迅速 占领 世界 市 场 。 电 动车 的 
检修 与 汽油 车 完全 不 同 ， 检 修 设 备 和 修理 站 也 将 是 一 个 商业 机 会 。 


谁 征 明天 有 的话 基 亚 


辆 目 动 当 驶 汽车 的 核心 是 传 感 历 、 计 算 能 力 和 软件 。 目 动 区 驶 
汽车 实际 是 一 个 会 目 己 高 速 行 走 的 机 器 人 “。 汽 车 最 重要 的 零 部 件 将 是 
电子 元 件 ， 目 前 一 辆 车 中 各 类 半导体 必 斤 成 本 大 约 500 糯 元， 预计 十 年 
后 一 辆 车 中 的 芯片 成 本 将 达到 5 000 美 元 。 一 辆 电动 自动 区 驶 车 本 质 上 
忠 是 一 台 有 四 个 辖 转 的 电脑 。 传 统 汽 车 的 核心 能 力 在 于 将 发 动机 、 传 
动 系统 等 机 械 子 系统 打磨 成 为 精密 的 工艺 品 。 但 一 夜 之 间 这 些 核 心 技 
能 不 重要 甚至 不 再 被 需要 了 ， 例 如 目前 的 电动 汽车 的 马达 加 速 已 经 大 
大 超过 最 好 的 汽 负 发动机， 而 且 不 需要 任何 传动 系统 。 目 动 要 驶 需要 
的 重要 技能 例如 计算 机 视觉 、 人 工 知 能 算法 等 都 不 是 传统 汽车 三 丙 的 
强项 。 第 一 次 芍 驶 特 斯 拉 半 目 动 电 动车 的 感觉 束 像 第 一 次 使 用 iPhone 
手机 ， 而 驾驶 传统 汽车 束 像 使 用 诺基亚 手机 。 传 统 汽 车 厂商 的 营销 染 
道 非常 “ 线 下 ”， 依 托 于 成 本 巨大 的 经 销 商 、 专 卖 店 和 维修 体系 。 电 动 


车 的 车 体 就 古 三 样 东西 ， 电 池 、 辕 团 和 号 达 。 一 辆 内 燃 发 动机 汽车 的 
零件 有 上 万 个 ， 而 一 辆 电动 车 的 机 械 和 零件 只 有 几 千 个 。 这 意味 着 发 生 
机 械 故 障 的 概率 和 维修 成 本 的 降低 。 由 于 零 部 件 的 减少 ， 电 动车 和 电 
脑 、 家 电 一 样 将 会 变 得 标准 化 。 这 使 电动 车 更 易于 在 线 销售 ， 这 将 叉 
一 次 冲击 传统 汽车 厂商 。 


谁 胜出 ? 的 符 律 还 十 侍 合 


传统 汽车 厂商 并 非 坐 以 竺 丝 ， 几 乎 所 有 的 整 车 六 商都 在 投 巨 资 研 
发 电动 车 和 目 动 概 驶 技术 。 通 用 汽车 和 福特 都 巨 资 收购 了 目 动 当 驶 软 
件 公司 ， 丰 田 在 斯 坦 福 大 学 旁边 斥资 10 亿 美元 打造 目 动 区 驶 研发 中 
心 ， 奔 驰 、 大 众 等 欧 系 车 三 也 是 全 力 以 赴 。 传 统 汽 车 广 商 仍然 有 许多 
新 进入 者 不 具备 的 能 力 。 第 一 个 能 力 是 大 规模 生产 制造 能 力 。 这 是 一 
个 设备 和 资金 密集 型 行业 ， 很 难 简单 地 通过 代 工 生产 解决 (世界 的 主 
要 代 工 厂商 例如 富士 康 目前 代 工 的 主要 是 电脑 手机 类 产品 ， 世 界 上 并 
没有 成 熟 的 汽车 代 工 厂商 ， 这 也 许 是 一 个 商机 ) 。 目 前 全 世界 汽车 生 
产 线 的 产能 过 剩 ， 痢 进入 者 完全 可 以 收购 一 条 生产 线 ， 但 仍然 面临 改 
造 生产 线 的 任务 。 传 统 汽 车 三 商 的 第 二 个 能 力 是 供应 链 管 理 。 传 统 汽 
车 厂商 对 市 场 需求 有 长 期 经 验 ， 对 库存 和 供应 链 管理 已 经 达到 精细 化 
程度 ， 这 两 个 技能 可 以 把 库存 风险 降 至 最 低 。 互 联网 厂商 通常 没有 供 
应 链 管理 和 库存 风险 管理 经 星 ， 更 不 擅长 流动 货 金 的 管理 和 运用 ， 稍 
有 不 慎 束 会 造成 重大 亏损 。 传 统 汽 车 厂商 的 第 三 个 重要 能 力 是 汽车 设 
计 能 力 ， 和 凭借 它们 对 客户 和 市 场 的 多 年 理解 ， 以 及 在 设计 细节 (例如 
安全 性 等 ) 上 的 经 验 积累 ， 不 会 出 现 太 多 诸如 召回 之 类 的 风险 。 而 对 
于 第 一 次 造 车 的 厂商 ， 难 免 有 芷 漏 ， 一 次 重大 召回 殉 可 能 置 公 司 于 和 死 
地 。 传 统 汽 车 厂商 的 第 四 个 能 力 是 对 线 下 经 销 商 的 管理 以 及 相应 的 个 
人 贷款 、 保 险 和 维修 体系 。 建 立 这 一 整套 体系 要 求 新 进入 者 投入 大 量 


人 资金， 招收 大 量 传统 产业 管理 人 员 ， 并 且 需 要 相当 长 时 间 的 学 习 和 


但 传统 汽车 厂商 的 最 大 软肋 就 是 软件 。 传 统 汽车 厂商 作为 总 系统 
集成 商 ， 目 己基 本 不 开发 软件 ， 它 们 的 任务 是 把 各 个 子 系统 的 软件 集 
成 到 一 起 ， 如 图 5.8 所 示 。 传 统 汽 车 厂商 的 软件 系统 集成 通常 会 出 现 两 
个 问题 ， 第 一 个 问题 是 软件 模块 之 间 不 兼容 所 造成 的 程序 漏洞 。 由 于 
各 个 软件 模块 是 由 不 同 厂商 写 的 ， 源 代码 又 未 必 公 开 ， 所 以 集成 商 即 
使 发 现 漏 洞 也 无 法 及 时 修复 ， 只 能 让 各 三 商 一 起 解决 。 而 且 一 个 漏洞 
有 时 很 难说 是 哪个 广 商 造成 的 ， 各 个 三 商 之 间 会 扯皮 。 第 二 个 问题 是 
当 一 个 软件 需要 更 新 时 ， 要 和 所 有 其 他 软件 共同 重新 测试 一 届 ， 这 样 
成 本 很 高 ， 使 随时 更 新 软件 变 得 几乎 不 可 行 。 而 汽车 软件 能 随时 下 载 
更 新 在 未 来 对 目 动 要 驶 至 关 重 要 ， 因 为 今后 5~10 年 和 目 动 要 驶 软件 随 着 
技术 进步 将 持续 快速 更 新 。 传 统 汽车 从 设计 定型 到 第 一 辆 汽车 出 三 需 
要 三 年 左右 的 时 间 ， 在 此 期 间 所 有 的 零 部 件 都 不 允许 改变 设计 。 但 在 
电脑 手机 行业 几乎 不 可 想象 一 个 软件 三 年 不 被 更 新 ， 目 前 特 斯 拉 汽 车 
几乎 每 个 月 都 有 一 次 软件 自动 更 新 。 另 外 ， 当 模块 增加 时 ， 又 加 上 很 
多 原来 没有 的 模块 ， 例 如 目 动 要 驶 模块 等 ， 软 件 的 可 靠 性 会 降低 。 这 
件 事 将 会 成 为 传统 厂商 的 阿 喀 琉 斯 之 中 。 对 于 新 进入 者 ， 特 别 是 电动 
车 来 说 ， 几 乎 所 有 的 软件 都 可 以 从 头 写 起 。 像 图 5.8 右 边 这 样 的 软件 结 
构 清 晰 简单 ， 易 于 检 错 纠 错 ， 还 可 以 随时 进行 更 狐 。 

OEMs: 隔绝 的 软件 包 Tesla: 中 央 操 作 系统 
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图 5.8 汽 车 软件 结构 《〈 左 图 是 传统 汽车 软件 集成 ， 右 图 是 电动 车 全 部 自己 开发 ) 


题 覆 俩 应 链 


任何 一 个 制造 业 产 业 ， 当 产量 大 到 某 一 个 数量 级 时 〈 例 如 上 千 万 
台 ) ， 就 开始 分 层 。 原 因 是 只 专注 于 一 个 水 平 层面 的 厂商 比 垂直 集成 
的 厂商 效率 更 高 。 产 业 分 层 的 必要 条 件 有 两 个 : 产量 足够 大 和 技术 成 
熟 。 汽 车 行业 历经 上 百年 的 演化 ， 早 已 变 成 一 个 多 层次 的 供应 链 生 
态 。 所 谓 供 应 链 就 是 这 个 产业 会 形成 由 不 同 公司 组 成 的 复杂 分 工 合作 
和 价值 增加 体系 。2017 年 全 球 共 销 售 7 800 万 辆 车 ， 按 每 辆 车 均 价 3.3 万 
美元 计算 ， 汽 车 产业 全 球 产 值 超过 两 万 亿美 元 。 届 于 供应 链 顶 端 (和 
消费 者 最 近 的 一 端 ， 通 常 也 是 生态 系统 中 砍 价 能 力 最 强 的 一 端 ) 的 是 
整 车 厂商 。 整 车 三 商 设 计 、 组 效 和 营销 汽车 ， 但 是 一 辆 汽车 上 几乎 所 
有 的 部 件 都 是 从 生态 系统 的 其 他 厂商 采 购 的 。 直 接 给 整 车 厂商 提供 完 
整 子 系统 (例如 发 动机 、 传 动 、 刹 车 、 转 向 、 音 响 等 的 叫 作 “一 级 系 
统 集成 商 ” (Tier-1 system integrator) ， 人 全球 有 上 百 家 一 级 系统 集成 
商 。 给 一 级 系统 集成 商 提 供 零 部 件 的 叫 二 级 系统 集成 商 。 甚 至 还 有 三 
级 供应 丙 等 ， 整 车 厂商 自己 几乎 不 制造 任何 部 件 。 除 了 少数 几 球 察 华 
车 以 外 ， 绝 大 部 分 乘 用 车 都 是 由 这 种 水 平分 层 的 供应 链 生 产 的 。 


像 汽 车 产业 这 种 传统 产业 的 供应 链 是 相对 稳定 和 静态 的 。 所 谓 稳 
定 是 指 汽车 行业 在 供应 链 各 层次 部 有 许多 成 熟 的 大 型 供应 商 并 且 多 年 
不 变 。 所 谓 静 态 征 指 一 辆 汽车 的 子 系统 和 有 堆 部件 由 哪些 厂商 提 供 在 汽 
车 定型 时 束 确 定 下 来 了 ， 在 这 辆 车 的 寿命 期 内 不 会 改变 。 但 目 动 区 驶 
将 会 打破 这 个 稳定 的 供应 链 ， 一 个 可 移动 的 、 联 网 的 目 动 要 驶 汽车 将 
成 为 继 电 脑 和 手机 之 后 的 下 一 个 超级 规模 信息 和 数据 平台 ， 原 来 的 静 
人 态 供 应 链 将 变 为 动态 的 生态 系统 。 除 了 供应 链 中 的 子 系统 和 和 零 部 件 生 
产 厂 商 以 外 ， 用 户 和 一 系列 内 容 服务 提供 商 也 将 参与 到 这 个 生态 系统 
中 来 一 起 为 生态 系统 增值 。 传 统 汽 车 供应 链 是 一 个 封 财 系统 ， 痢 汽车 


的 生态 系统 是 一 个 开放 系统 。 传 统 供应 链 是 稳定 和 静态 的 ， 新 生态 系 
统 将 是 变化 和 动态 的 ， 竺 别 是 内 容 和 服务 。 玩 转 这 个 动态 的 生态 系 
统 ， 又 是 许多 新 进入 者 的 强项 。 


合 纵 连 横 


在 传统 汽车 产业 链 中 ， 整 车 厂商 暑 无 疑问 大 于 龙头 地 位 ， 具 有 最 
强 的 砍 价 能 力 ， 但 是 在 自动 芍 驶 生态 系统 中 ， 谁 将 是 产业 链 龙 头 还 有 
待 观察。 如 果 汽 车 旭 变 为 电脑 和 手机 ， 那 么 掌握 核心 必 片 和 操作 系统 
的 厂商 可 能 变 为 龙头 。 如 采 汽 车 妨 变 为 像 互 联网 一 样 的 信息 数据 平 
台 ， 那 么 掌握 用 户 的 内 容 服 务 提 供 商 可 能 变 为 龙 涉 。 有 一 点 很 清楚 ， 
不 论 谁 想 成 为 产业 链 龙 头 ， 都 要 掌控 目 动 驾驶 软件 。 目 前 围绕 着 目 动 
雪 驶 软件 在 类 国 市 场 已 经 形成 了 数 个 竞争 集团 。 

第 一 个 集团 是 围绕 在 图 形 忌 片 厂商 英 伟 达 周 围 的 供应 两 集团 。 这 
个 集团 包括 整 车 三 商 丰 田 、 奥 迪 、 福 符 ， 一 级 供应 丙 中 的 老大 博世 
(Bosch) ， 自 动 营 驶 软件 平台 提供 商 百 度 等 。 这 个 集团 侧重 的 是 提供 
需要 更 强大 计算 功能 的 L3 和 L4 自 动 要 驶 解决 方案 。 


第 二 个 集团 是 以 英特尔 2016 年 收购 的 以 色 列 公司 Mobileye 为 首 的 
供应 商 集团 ， 这 个 集团 包括 Mobileye 的 东家 英特尔 、 整 车 厂商 宝马 、 
一 级 供应 商 前 十 大 厂商 之 一 的 德尔 福 (Delphi) 等 。 这 个 集团 提供 
L2~L4 的 解决 方案 。 

第 三 个 集团 是 以 高 通 公 司 曾经 想 收 购 的 NXP 公司 为 首 的 供应 商 集 
团 。 这 个 集团 包括 整 车 厂商 奥迪 (也 同时 和 英 伟 达 集 团 合作 ) ， 一 级 
供应 商 中 前 九 大 厂商 之 一 的 采 埃 孚 (ZF) 。 

在 这 三 个 集团 中 ， 英 伟 达 集团 的 AI 芯片 能 力 最 强 ， 但 Mobileye 集 
团 几 乎 垄断 了 L2 半 自动 驾驶 市 场 。 未 来 的 争斗 将 主要 在 这 两 个 集团 之 
间 进 行 。 


这 种 结盟 说 明了 两 个 问题 : 一 是 新 技术 者 产品 在 成 熟 的 过 程 中 需 
要 产业 链 各 单元 更 紧密 的 合作 其 至 王 直 和 集成， 二 是 说 明 目 动 区 驶 解决 
方案 非常 复杂 ， 没 有 一 家 公司 可 以 单独 提供 。 在 这 种 三 足 己 立 的 情形 
下 ,传感器 供应 商 例如 激光 雷达 可 能 被 进 选 边 站 队 ， 加 入 一 家 集团 。 
因为 英 伟 达 和 Mobileye 本 喘 束 在 自己 的 心 片 上 提供 目 动 敬 驶 软件 解决 
方案 ， 大 部 分 独立 的 目 动 驾 驶 软件 解决 方案 新 创 公司 只 能 寄 布 望 于 目 
己 的 软件 解决 方案 比 三 大 集团 的 方案 更 优秀 ， 最 终 倍 三 大 集团 之 一 ， 
或 者 被 某 整 车 三 丙 收购 。 


除了 以 上 三 个 提供 解决 方案 的 集团 之 外 ， 合 歌 也 是 最 重要 的 目 动 
区 驶 解决 方案 提供 商 。 谷 歌 从 2009 年 开始 就 研究 目 动 芍 驶 ， 试 验 车 在 
谷歌 总 部 加 利 福 尼 亚 州 山 景 城 已 经 行驶 超过 了 483 万 千 米 。 谷 歌 的 目标 
从 第 一 天 开始 殉 是 提供 L5 的 全 目 动 要 驶 方案 。 它 不 仅 是 市 场 上 第 一 个 
研究 目 动 芝 驶 的 ， 而 且 是 今天 被 公认 为 最 成 熟 可 靠 的 目 动 要 驶 解决 方 
案 提供 商 。 但 谷歌 似乎 并 没有 全 力 以 赴 把 它 的 解决 方案 卖 给 整 车 三 
商 ， 而 是 直接 和 分 享 出 行 公司 Lyft (来 福 车 ) 进行 战略 合作 。 

当 一 个 产业 产量 小 或 者 技术 更 新 很 快 时 ， 垂 直 集 成 往往 是 更 好 的 
选择 ， 即 由 一 家 公司 直接 购买 所 有 的 零 部 件 ， 甚 至 目 己 生产 部 分 零 音 
件 。 电 动 汽车 的 量 一 定 会 很 大 ， 但 技术 还 在 快速 发 展 ， 特 斯 拉 与 当年 
苹果 公司 做 电脑 和 手机 一 样 ， 远 择 了 垂直 集成 。 它 不 仅 用 目 己 的 半 目 
动 驾 驶 方案 取代 了 Mobileye 的 方案 ， 甚 至 目 己 人 研发 芯片 和 传感器 。 秋 
直 集 成 的 优势 古 完 全 掌控 产品 的 性 能 和 用 户 体 验 ， 劣 势 是 要 投入 大 量 
的 研发 成 本 。 总 体 来 讲 垂直 集成 产品 更 好 ， 但 比 水 平分 层 价 格 更 高 。 
所 以 许多 没有 那么 财 大 气 粗 的 电动 汽车 的 新 进入 者 仍然 选择 供应 链 模 
式 。 到 抵 熟 优 执 劣 很 难说 ， 当 年 笠 采 电脑 选择 垂直 集成 后 ， 败 给 了 更 
便宜 的 个 人 电脑 《后 来 改 用 英特尔 芯片 再 加 上 设计 的 改进 才 又 夺回 一 
部 分 市 场 份额 ， 但 已 经 不 是 市 场 第 一 了 ) 。 苹 果 手 机 到 今天 还 是 垂直 
集成 ， 虽 然 市 场 份额 一 直 在 受 安 晶 手机 的 看 食 ， 但 仍然 是 市 场 第 一 。 
几乎 可 以 断定 在 今后 5~10 年 电动 车 的 产品 性 能 和 用 户 体验 一 定 是 特 斯 
拉 这 样 的 垩 直 集 成 厂商 更 好 ， 水 平分 层 厂 商 只 能 靠 价格 优势 。 目 前 除 


了 特 斯 拉 以 外 卖 得 最 好 的 两 款 电动 汽车 分 别 是 通用 汽车 的 Bolt 和 日 产 
的 Leaf。 前 者 在 美国 的 售 价 和 特 斯 拉 3 型 车 的 售 价 相 同 ， 约 为 3.5 万 美 
元 ， 两 者 巡航 距离 都 是 320 千 米 左 右 。 日 产 Leaf 在 美国 售 价 为 3 万 闫 
元 ， 但 巡航 距离 只 有 240 千 米 。 这 两 款 车 都 没有 半 目 动 区 驶 功能 ， 从 设 
计 和 功能 上 对 用 户 来 说 不 够 新 潮 。 


共 盏 其 禾 出 行 


20 世 纪 初 汽车 刚 被 发 明 时 ， 绝 大 部 分 人 能 想到 汽车 因为 比 马 车 更 
快 所 以 未 来 会 取代 马车 。 但 很 少 有 人 能 想到 未 来 汽车 还 能 市 来 哪些 其 
他 变化 。 人 们 无 法 想象 由 于 汽车 的 速度 ， 人 们 可 以 搬 到 郊区 居住 。 由 
于 郊区 地 方 大 ， 人 们 的 住宅 会 由 城 里 的 高 层 公 寓 变 为 独家 独院 的 小 
楼 。 由 于 人 们 居住 的 分 散 化 ， 郊 区 开始 出 现 有 大 俘 车 场 的 购物 中 心 。 
由 于 居住 在 郊区 ， 所 以 进一步 增强 了 对 汽车 的 需求 ， 由 于 汽车 你 有 量 
的 急剧 增加 ， 大 量 多 车 道 的 快速 道路 和 高 速 公 路 开始 修建 。 由 于 出 行 
的 方便 ， 旅 游 和 度假 成 为 普通 大 众 的 生活 娱乐 方式 。100 年 来 汽车 的 出 
现 彻底 改变 了 都 市 和 乡村 的 地 貌 ， 改 变 了 人 类 的 基本 生活 方式 ， 改 变 
了 社会 组 织 。 

同样 ， 目 动 芍 驶 也 绝 非 仅 仅 取代 人 来 各 驶 汽车 ， 我 们 今天 能 够 看 
到 的 只 十 未 来 可 能 性 的 一 部 分 。 对 汽车 产业 冲击 最 大 的 也 不 是 技术 变 
化 市 来 的 新 进入 者 ， 而 是 技术 变化 冲 来 的 产业 形态 的 变化 ， 其 中 最 大 
的 变化 之 一 殉 是 目 动 芍 驶 将 使 目 己 买 车 并 且 独 吾 变 得 极为 不 经 济 ， 共 
训 出 行将 成 为 最 经 济 的 选择 。 目 前 在 美国 每 英里 芍 驶 成 本 约 为 1 美元 ， 
每 年 供养 一 辆 汽车 的 成 本 约 为 10 000 美 元 (包括 车 辆 折旧 、 保 养 、 加 
油 、 各 种 牌照 、 保 险 等 ) 。 在 大 都 市 由 于 停车 不 便 和 道路 拥挤 ， 私 家 
车 的 成 本 更 高 ， 但 一 辆 私家 车 的 利用 率 只 有 5%。 目 前 即使 还 是 人 工交 
驶 ， 共 至 出 行 的 成 本 也 已 经 接近 或 低 于 私家 车 。 有 数据 表明 ， 每 一 辆 
共 至 汽车 的 使 用 将 会 至 少 减少 5 辆 私家 车 。 所 以 在 旧金山 等 美国 大 城 


市 ， 年轻 人 买 车 的 比例 开始 明显 下 降 。 目 前 共享 出 行 汽 车 成 本 中 70% 
是 人 工 。 一 旦 实现 大 规模 自动 芍 驶 ， 共 享 出 行 成 本 将 降低 到 目前 的 
30%。 有 人 研究 表明 ， 自 动 萄 驶 的 共享 出 行 成 本 将 是 私家 车 的 10%， 到 
2030 年 私家 车 将 降低 到 今天 的 20%， 美 国 汽 车 总 保有 量 将 从 2.5 亿 辆 降 
至 5 000 万 辆 ， 石 油 的 总 需求 量 将 从 每 天 1 亿 桶 降 至 7 000 万 桶 ， 这 一 切 
将 为 美国 家 庭 每 年 季 约 1 万 亿美 元 。 未 来 个 人 仍然 可 能 会 买 车 ， 但 不 会 
独占 这 辆 车 ， 未 来 拥有 车 辆 的 方式 可 能 有 两 种 : 第 一 种 是 自己 优先 使 
用 ， 当 自己 不 用 时 放出 去 为 别人 服务 ， 第 二 种 是 自己 买 车 作为 投资 加 
入 一 个 共享 出 行 的 组 织 。 


目前 在 美国 用 手机 打车 的 平均 等 每 时 间 是 3 分 钟 ， 在 中 国 由 于 交通 
拥挤 ， 平 均等 得 时 间 更 长 ， 特 别 是 上 下 班 高 峰 。 当 共 于 出行 成 为 出 行 
的 主要 方式 时 ， 由 于 参与 的 车 辆 增加 ， 所 以 平均 等 每 时 间 会 进一步 降 
低 。 目 动 芍 驶 市 来 的 邦 一 个 变化 是 大 都 市 的 道路 拥挤 将 一 去 不 复 返 。 
目前 许多 类 国 城市 已 经 开始 停止 道路 扩建 规划 ， 俘 止 修 建新 的 停车 
场 ， 甚 至 开始 考虑 将 已 有 的 停车 场 改 为 微型 城市 绿地 。 未 来 城市 交通 
规划 也 将 深 受 共享 出 行 影响 ， 城 市 交通 将 形成 以 高 速 轨道 交通 和 目 动 
当 驱 及 目 行 车 为 主 的 公共 交通 系统 。 高 速 扫 道 系统 负责 远 距 离 主 干线 
运输 ， 目 动 革 驶 和 目 行车 负责 文 线 和 最 后 一 千 米 。 当 上 下 班 更 依赖 扫 
道 交 通 时 ， 轨 道 交 通 将 面临 提速 的 压力 。 目 前 中 国 各 地 地 铁 的 平均 区 
间 行 驶 速度 是 每 小 时 30~50 千 米 ， 这 个 速度 完全 可 以 再 提高 一 两 倍 。 以 
北 各 这 样 的 超大 城市 为 例 ， 如 有 果 从 五 环 外 到 国贸 上 班 ， 目 动 敬 驶 可 以 
根据 地 铁 时 刻 表 精确 地 在 地 铁 站 接送 ， 使 整个 通勤 时 间 缩 减 至 少 一 


目 动车 驶 将 为 房屋 建筑 之 来 变化 ， 例 如 大 量 的 独院 房屋 不 再 需要 
车 库 ， 大 量 高 层 公 寓 不 再 需要 这 么 多 停车 位 等 。 目 动 当 驶 还 会 给 社区 
市 来 新 的 变化 ， 例 如 上 下 班 方向 相同 的 邻居 将 会 每 天 有 见面 或 接触 的 
Yl 


汽车 内 部 的 设计 将 被 和 目 动 要 驶 根本 性 地 改变 ， 例 如 多 人 共 吾 的 一 
辆 自动 芍 驶 汽车 内 部 可 能 会 分 为 儿 个 私密 的 空间 ， 大 屏幕 地 图 显示 和 
视听 娱乐 设备 将 成 为 标准 配置 ， 车 中 将 有 自动 饮料 售 货 机 等 。 车 型 也 
会 发 生 巨 大 分 化 ， 根 据 不 同 的 需求 ， 可 能 出 现 可 以 睡觉 的 车 、 可 以 打 
牌 的 车 、 可 以 唱 卡 拉 OK 的 车 ， 等 等 。 

未 来 自动 匠 驶 汽车 大 部 分 将 是 电动 车 ， 电 动车 还 会 给 汽车 基础 设 
施 带 来 巨大 变化 。 第 一 个 变化 是 当 汽 油 车 减少 时 ， 加 油 站 也 会 减少 ， 
加 油 变 得 不 方便 也 将 会 进一步 减少 汽油 车 ， 如 此 循环 下 去 ， 汽 油 车 可 
能 会 和 今天 的 柴油 车 一 样 稀 少 。 第 二 个 变化 是 维修 体系 。 由 于 个 人 不 
再 拥有 汽车 ， 所 以 汽车 的 管理 和 维修 将 主要 由 出 行 公司 负责 ， 车 辆 的 
检修 和 维护 将 更 程序 化 与 集中 化 ， 个 体 的 修 车 店 将 消失 。 

自动 芍 驶 将 改变 汽车 保险 业 。 目 前 的 汽车 交通 事故 中 90% 以 上 是 
人 的 原因 。 当 道路 上 大 部 分 是 自动 特 驶 车 辆 时 ， 交 通 事故 率 将 大 大 下 
降 。 研 究 表明 ， 美 国 车 险 市 场 到 2040 年 将 从 现在 的 年 度 2 000 亿 美元 下 
降 为 800 亿 美元 ， 下 降 60% 。 


以 上 的 变化 都 是 今天 可 以 预见 到 的 ， 还 有 许多 变化 是 更 间接 隐蔽 
的 ， 今 天 不 容易 预见 。 例 如 今天 共 至 出 行 主要 由 几 家 全 球 性 的 移动 互 
联网 平台 公司 提供 ， 服 务 主要 是 车 辆 的 安全 保障 、 和 光驱 员 管 理 、 目 动 
路 线 规划 等 。 当 车 辆 目 动 当 驶 后 ， 这 些 流程 的 成 本 会 越 来 越 低 。 再 加 
上 共 至 出 行 的 本 地 化 特点 以 及 和 其 他 公共 交通 的 紧密 关联 ， 示 来 共 至 
出 行 很 可 能 会 整合 为 本 地 公共 交通 出 行 服务 中 的 一 部 分 ， 由 本 地 机 构 
以 极 低 的 成 本 提供 ， 而 不 是 由 几 家 全 球 或 全 国 性 公司 统一 提供 。 


运输 和 物流 


目 动 芝 驶 市 来 的 另 一 个 巨大 变化 将 体现 在 运输 和 物流 行业 。 目 前 
美国 和 中 国都 有 一 批 新 创 公 司 在 研究 卡车 目 动 区 驶 、 港 口 装 秋 、 仓 储 


目 动 拣 选 分 配 和 目 动 快递 。 相 对 于 乘 用 车 ， 货 物 运 输 卡 车 大 量 时 间 坪 
在 高 速 公 路 上 区 驶 ， 权 处理 的 状况 相对 简单。 目前 在 类 国人 工 成 本 占 
卡车 运输 的 40%， 汽 油 占 25%， 自 动 驾 驶 和 电动 车 将 使 卡车 运输 的 成 
本 降低 至 少 一 半 。 港 口 、 堆 场 、 矿 山 、 农 场 、 建 筑 工 地 、 仓 库 等 相对 
封闭 的 场合 比 城市 要 驶 的 情形 更 为 简单 。 即 使 在 技术 早期 ， 也 不 会 有 
过 多 人 号 生命 安全 风险 ， 在 这 些 领域 将 会 率先 实现 目 动 当 驶 。 在 每 一 
个 目 动 当 驶 的 垂直 市 场 都 可 以 造 束 一 个 市 值 超 过 10 亿 类 元 的 “ 独 角 
时 ”企业 。 今 天 中 国 的 各 种 物品 的 快递 主要 依赖 于 廉价 劳动 力 ， 随 着 劳 
动力 成 本 的 提高 ,，“ 最 后 一 公里 ”快递 自动 化 (上 自动 敬 驶 汽车 和 无 人 
机 ) 也 将 早 于 乘 用 车 上 自动 驾驶 的 全 面 普及 。 


中 国 的 机 会 


即使 目 动 要 驶 局 限 在 狭义 的 造 车 产业 ， 也 将 会 创造 全 球 每 年 2 万 亿 
美元 的 机 会 。 如 果 加 上 对 其 他 行业 的 影响 ， 目 动 区 驶 产生 的 商业 机 会 
可 能 在 十 年 后 达到 每 年 十 万 亿 类 元 的 数量 级 。 目 动 区 驶 将 是 中 国 今 后 
10~20 年 面临 的 最 大 的 一 个 全 球 性 产业 机 会 。 


1. 庞 大 的 制造 业 能 力 和 全 球 第 一 的 电子 制造 生态 系统 


未 来 的 目 动 当 驶 电动 汽车 主要 是 一 个 电子 产品 ， 而 中 国 的 电子 制 
造 业 规模 和 水 平 都 已 经 是 世界 一 流 (核心 芯片 除外 ) 。 中 国 的 汽车 产 
量 在 2016 年 已 经 达到 2 800 万 辆 ， 成 为 世界 第 一 。 中 国 的 汽车 产业 的 短 
板 在 于 发 动机 和 目 动 变速 箱 等 ,但 电动 汽车 恰恰 同时 里 越 了 这 几 个 短 
板 。 目 动 驾 驶 的 核心 硬件 主要 十 各 类 传感器 ， 例 如 GPS、 声 呐 、 唉 米 
流 雷 达 和 油光 雷达 ， 这 些 电子 零 部 件 者 能够 在 中 国生 产 。 所 以 强大 的 
电子 制造 能 力 将 成 为 中 国 最 大 的 优势 。 


2. 具 有 前 脆性 的 新 能 源 和 环保 政策 


中 国 目 前 是 全 世界 空气 污染 最 挛 重 的 国家 之 一 ， 同 时 也 是 碳 排放 
量 最 大 的 国家 。 中 国政 府 为 了 迅速 改善 空气 质量 和 大 幅 降 低 矶 排放 
量 ， 制 定 了 全 世界 最 具有 力度 的 鼓励 发 展 狐 能 源 的 政策 。 与 此 同时 ， 
2017 年 上 台 的 美国 总 统 唐纳德 ' 特 衣 普 在 新 能 源 政策 上 大 幅度 倒退 ， 这 
给 中 国 提供 了 一 个 成 为 全 世界 新 能 产 技术 领导 者 的 机 会 。 


3. 发 达 的 交通 基础 设施 和 现代 物流 


中 国 四 通 八 达 的 高 速 公路 以 及 发 达 的 物流 ， 为 目 动 驾驶 技术 提供 
了 世界 最 大 的 垂直 市 场 。 


4. 电 动车 发 展 速度 快 


中 国 目 前 对 电动 车 的 政策 补贴 力度 是 全 世界 最 大 的 。2017 年 中 国 
共 销 售 60 万 辆 电动 车 ， 比 2016 年 增加 71% ， 占 全 世界 总 量 的 一 半 。 随 
着 规模 的 增加 ， 中 国生 产 的 电动 车 (包括 动力 电池 ) 成 本 会 更 低 ， 中 
国 的 电动 车 将 具有 大 规模 出 口 的 潜力 。 


5. 世 界 第 一 大 共享 出 行 市 场 

中 国 目 前 也 是 世界 第 一 大 共享 出 行 市 场 。 截 至 2018 年 3 月 ， 涌 滴 出 
行 每 天 提供 2 500 万 次 服务 ， 美 国 的 Uber ( 优 步 ) 在 其 提供 服务 的 78 个 
国家 每 天 共 提 供 约 1 000 万 次 服务 。 


6. 移 动 支付 世界 普及 率 最 高 


中 国 的 手机 支付 量 世 界 第 一 ， 为 共 至 出 行 和 未 来 一 系列 复杂 的 商 
业 模 式 提 供 了 基础 。 


7. 复 杂 多 元 的 驾驶 场景 


目 动 罗 驶 软件 是 一 个 “大 杂烩 ”， 主 要 靠 大 量 的 数据 学 习 和 软件 迭 
代 ， 中 国 提 供 了 大 量 的 数据 和 复杂 的 场景 ， 在 中 国 场 景 学 习 出 来 的 区 
驶 软件 在 其 他 地 方 适应 性 会 很 强 。 


8. 对 中 国 上 自动 驾驶 产业 政策 的 建议 
(1) 继续 梯度 式 补 贴 电 动车 ， 直 到 在 不 补贴 情形 下 电动 车 的 购买 
+ 保有 成 本 低 于 同 档次 的 汽油 车 。 


(2) 顺应 技术 对 产业 的 颠覆 ， 打 破 地 方 政府 资 本 造成 的 分 散 格 
局 ， 鼓 励 产业 重组 。 


(3) 自动 敬 驶 在 成 熟 的 过 程 中 难免 会 出 事故 ， 不 能 因 嘻 废 食 。 
(4) 技术 创新 主要 依靠 市 场 和 企业 ， 竺 别 是 高 科技 创新 企业 。 
(5) 创新 先行 ， 监 管 押 后 。 


天 于 目 动 营 驶 的 六 种 预测 


预测 未 来 永远 有 风险 ， 但 可 以 促使 目 己 深入 思考 ， 也 能 引起 有 质 


量 的 讨论 。 


1. 2022 年 以 后 半 目 动物 驶 功能 将 成 为 所 有 15 万 元 人 民 币 以 
上 车 型 的 标 配 


半自动 芍 驶 包括 2016 年 特 斯 拉 率 先 推出 的 自 适 应 巡航 (自动 和 前 
车 保持 距离 ) 、 自 动 紧急 刹车 、 自 动 线 道 保持 、 自 动 换 道 、 自 动 泊 车 
等 基本 功能 。 目 前 ， 这 些 功能 所 需 的 硬件 成 本 摄像头、 毫米 波 雷 
达 、 处 理 必 片 等 ) 不 超过 5 000 元 人 民 币 。2016 年 中 国生 产 了 2 800 万 辆 
汽车 ， 跃 居 世 界 第 一 ， 每 辆 车 均 价 13 万 元 人 民 币 。 假 设 汽车 均 价 每 年 


增长 3%，2022 年 汽车 均 价 会 达到 15 万 元 人 民 币 ， 届 时 所 有 均 价 以 上 车 
型 都 将 配备 半 目 动 当 驶 功能 。 


2. 分 步 演进 成 为 主流 


目前 许多 厂家 宣称 2021 一 2022 年 会 推出 L5 全 自动 鸭 驶 汽车 ， 这 个 
目标 很 难 实现 ， 乘 用 车 不 会 一 次 到 位 L5， 其 至 不 会 一 步 到 位 L4。 下 一 
步 是 在 半自动 基础 上 再 加 上 交通 标志 识别 和 本 地 高 精度 地 图 ， 这 样 就 
能 够 做 到 在 都 市 地 区 把 每 天 上 下 班 通勤 自动 化 ， 这 就 能 够 带 来 90% 的 
便利 ， 其 他 10% 的 长 尾 情况 可 以 逐步 解决 。2021 一 2022 年 有 望 实现 这 
样 的 便利 。 


3. 非 限定 场景 乘 用 车 全 目 动 切 驶 到 来 的 时 间 比 想象 得 晚 
最 后 的 10% 将 要 耗费 比 前 面 90% 多 得 多 的 时 间 。 由 于 在 非 限定 区 
域 各 驶 的 复杂 性 以 及 覆盖 大 范围 的 高 精度 地 图 尚 需 时 日 ， 所 以 真正 的 


非 限 定 区 域 的 无 方 辐 强 全 目 动 区 驶 至 少 需要 十 年 以 上 的 时 间 ， 也 许 会 
进入 一 个 瓶颈 期 ， 很 长 时 间 也 解决 个 了 。 


4. 垂 直 市 场 将 早 于 乘 用 车 市 场 


率先 成 熟 的 市 场 是 那些 驾驶 环境 相对 简单 的 行业 应 用 ， 如 海港 、 
货场 、 矿 山 、 农 业 、 基 建 、 仓 储 、 货 物 运输 、 旅 游 景 区 等 。 


5. 新 进入 者 将 逐步 占领 市 场 

从 电子 制造 业 和 互联 网 行业 进入 汽车 行业 的 新 进入 者 ， 在 十 年 内 
将 “ 吃 挥 ?一半 以 上 的 汽车 市 场 。 未 来 产业 融合 更 多 的 是 新 科技 巨头 收 
购 传统 汽车 公司 。 


6. 中 国 制 造 将 成 为 世界 领袖 


中 国电 动车 制造 规模 将 成 为 世界 领袖 ， 同 时 将 制造 全 球 80% 以 上 
的 传感器 ， 包 括 蝇 米 波 雷达 和 激光 雷达 。 在 技术 上 除了 核心 处 理 心 户 
以 外 全 面 领先， 特别 是 需要 复杂 场景 训练 迭代 的 目 动 区 驶 软件 。 


以 上 对 未 来 做 出 的 儿 个 明确 而 不 舍 糊 的 预测 ， 等 竺 未 来 验证 。 


医疗 与 健康 一 一 世界 上 最 有 经 验 的 医生 


医疗 健康 是 AI 最 热门 的 应 用 领域 之 一 ， 医 疗 行业 有 太 多 的 方面 可 
以 借助 AI 得 到 质 的 提升 。 据 追踪 风 投 动态 的 数据 公司 CB Insights 的 数 
据 显 示 ， 从 2012 年 至 2017 年 7 月 ， 医 疗 行业 有 270 笔 投 融 资 交 易 。 语 音 
识别 、 图 像 识 别 技 术 、 深 度 学 习 技术 已 经 和 医疗 行业 快速 融合 ， 在 畏 
助 诊疗 、 医 学 有 影像、 药品 研发 、 数 字 健 康 、 疾 病 预 测 、 虚 拟 护士 等 领 
域 应 用 ， 提 升 药 品 的 研发 速度 、 医 生 的 诊断 医治 效率 、 患 者 的 健康 管 
理 等 。 医 疗 数 据 目 前 较为 分 散 ， 这 给 不 少 创业 公司 提供 了 从 垂直 领域 
切入 的 机 遇 。 


医学 影像 


AI 在 医疗 健康 领域 的 第 一 个 重要 的 应 用 是 医学 影像 诊断 。2016 年 
11 月 ， 美 国 FDA (食品 药品 监督 管理 局 ) 颁发 了 第 一 个 医疗 AI 软件 平 
台 的 许可 。 这 个 软件 平台 是 斯 坦 福 大 学 校友 创办 的 Arterys 心 脏 核磁 共 
振 成 像 诊 断 平台 。 这 个 平台 用 1 000 个 已 知 图 像 对 模型 进行 了 训练 。 心 
脏 可 以 分 为 17 个 部 分 ， 通 过 这 些 部 分 的 影像 可 以 判断 心脏 是 否 有 问 
题 。 要 通过 FDA 批 准 ， 这 个 平台 的 判断 至 少 要 和 专业 医生 一 样 准确 ， 
这 个 平台 可 以 在 15 秒 内 做 出 判断 ， 而 有 经 验 的 医生 通常 需要 半 小 时 到 
一 小 时 ， 比 医生 快 了 200 倍 左右 。 


我 们 知道 癌症 早期 发 现 的 治愈 率 远 远 高 于 中 晚期 。 如 果 发 现 得 
早 ， 那 么 五 年 存活 率 可 以 达到 97%， 但 如 果 在 最 晚期 发 现 ， 那 么 五 年 
存活 率 只 有 14%。 如何 让 那些 不 方便 看 皮肤 科 医 生 的 人 能 够 最 早 发 现 
病情 不成 为 关键。 美国 每 年 有 540 万 例 皮 肤 况 ，2017 年 初 ， 斯 坦 福 大 学 
AI 实验 室 的 Thrun ( 特 伦 ) 教授 的 博士 生 开 发 出 了 一 个 可 以 诊断 皮肤 癌 
的 AI 算法 。 他 们 用 已 经 认证 过 的 370 张 含有 恶性 皮肤 癌 和 恶性 黑色 素 瘤 
的 图 片 让 算法 和 21 位 皮肤 科 医 生 的 判断 相 比 较 ， 算 法 在 各 方面 都 达到 
了 和 医生 相同 的 判断 准确 度 。 

中 国 是 全 球 肺 癌 死 亡 率 和 发 病 率 最 高 的 国家 。 据 测算 仅 2015 年 中 
国 就 有 429.2 万 新 发 肿瘤 病例 和 281.4 万 死亡 病例 ， 肺 癌 是 发 病 率 最 高 的 
肿瘤 ， 也 是 癌症 死因 之 首 。2015 年 中 国 新 发 47.7 万 例 食管 癌 ， 占 全 球 
的 50%。 新 增 肺癌 病例 73.33 万 ， 占 全 球 的 35.8%， 中 晚期 占 70%。 目 前 
最 有 效 的 手段 就 是 筛 查 ， 早 期 诊断 和 早期 治疗 能 将 患者 的 五 年 生存 率 
提高 到 80% 以 上 。 

表 5.1 中 国 、 美 国 、 英 国 的 癌症 发 病 率 与 死亡 率 


中 国 美国 英国 


13.5 亿 3.14 亿 6300 万 


75 岁 前 患 癌症 的 风险 16.8% 31.1% 26.9% 


75 岁 前 因 癌 症 死 亡 的 风险 11.5% 11.2% 11.3% 


癌症 死亡 率 /发病 比 率 70% 33% 40% 


资料 来 源 ，IARC《 五 大 洲 癌症 发 病 率 》 。 

肺癌 早 沛 的 难点 主要 是 : 早期 肺癌 多 表现 为 肺 部 结 节 。 它 们 尺寸 
小 ， 对 比 度 低 ， 非 常 容易 跟 其 他 的 组 织 部 位 混淆， 患者 的 CT 扫描 数量 
通 第 超过 200 层 ， 人 工 阅 片 耗 时 耗 力 。 腾 讯 公司 推出 的 “腾讯 疯 影 ” 技 
术 ， 利 用 多 尺度 三 维 卷 积 神经 网 络 实现 肺 部 图 像 的 三 维 分 割 与 重建 ， 


结合 金 标准 〈 指 当前 临床 医学 界 公 认 的 诊断 疾病 的 最 可 靠 、 最 准确 、 
最 好 的 诊断 方法 ) 病理 诊断 数据 和 大 量 医 生 标 注 的 结 节 位 置信 息 
3~10 毫 米 肺 结 节 检测 准确 率 达 到 95% ， 肺 癌 识 别 率 已 经 达到 809%6， 并 
且 还 能 通过 增强 图 像 与 放大 片子 辅助 医生 查看 。 目 前 ， 该 技术 已 经 与 


数 家 二 甲 医院 进行 合作 。 该 类 技术 的 逐步 商用 有 望 大 幅 降 低 癌 症 患 者 
的 发 现 率 和 死亡 率 。 


肺 部 CT 图 像 模板 提取 语 症 分 类 提取 候选 框 


图 5.9 人 工 吞 能 在 早期 肺癌 篇 查 中 的 应 用 


图 片 来 源 : 腾讯 觅 影 。 


表 5.2 50 例 早期 肺癌 筛 查 人 机 对 比 实验 结果 


人 机 对 比 实验 早期 肺癌 ( 敏感 度 ) 良性 样本 ( 特异 度 ) 


腾讯 碗 影 96% 88% 


20 名 三 甲 医院 
主治 医生 以 上 
(包括 数 名 主任 医生 ) 平均 


资料 来 源 : https://miying.qq.com/official/product/lung 。 


医疗 图 像 识 别 比 人 脸 图 像 识 别 要 困难 。 例 如 早期 肿瘤 的 诊断 ， 人 
体 组 织 古 否 有 病变 常常 表现 为 该 组 织 影像 的 大 小 、 形 状 、 灰 度 上 细微 
的 莽 别 。 与 人 脸 图 像 识别 相 比 较 ， 医 疗 图 像 识 别 的 挑战 在 于 病变 组 织 
的 形状 和 样 态 变化 非常 大 。 这 些 变化 由 下 列 因 素 造 成 。 
(1) 成 像 噪音 。 由 于 在 使 用 医疗 成 像 仪器 时 照射 剂量 和 显影 剂 浓 
度 不 同 ， 所 以 组 织 的 清晰 度 差别 很 大 。 


(2) 患者 个 体 差 别 。 患 者 的 身高 、 体 重 、 器 官 大 小 、 脂 肪 厚薄 都 
会 影响 成 像 。 

(3) 患者 在 成 像 过 程 中 的 姿势 、 动 作 和 器 官 活 动 也 会 影响 成 像 。 

(4) 内 脏 器 官 的 位 置 ， 例 如 器 官 之 间 的 接触 和 人 挡 会 影响 成 像 。 


(5) 医疗 判断 的 准确 性 和 可 靠 性 要 求 。 与 大 部 分 人 脸 识别 不 同 ， 
医疗 图 像 的 判断 关乎 人 命 ， 不 可 出 错 。 

为 了 使 医疗 图 像 识 别 更 准确 ， 通 党 借 助 下 列 两 个 办 法 。 

第 一 ， 大 数据 库 。 美 国 每 年 有 9 000 万 张 CT 片子 ， 训 练 数据 集 越 
大 ， 各 种 情形 殉 包 含 得 越 多 。 

第 二 ， 解 放学 和 病理 学 背景 知识 。 所 有 的 医疗 图 像 都 来 目 人 体 的 
某 一 个 部 分 ， 解 剖 学 和 病理 学 的 知识 可 以 帮助 识别 和 判断 。 但 解剖 学 
和 病理 学 知识 通常 用 于 基于 规则 的 判断 或 者 是 基于 病理 模型 的 判断 。 
但 这 两 种 方法 无 法 融入 神经 网 络 模型 ， 所 以 只 能 和 神经 网 络 并 行使 
用 。 当 两 者 判断 一 致 时 可 以 增加 神经 网 络 判 断 的 可 信和 度 ， 但 当 两 者 判 
断 不 一 致 时 ， 该 相信 哪 一 个 的 判断 呢 ? 最 后 还 是 需要 有 经 验 的 医生 。 


目前 的 人 工 智能 医疗 影像 识别 判断 的 主要 作用 十 辅助 判断 ， 还 不 
能 不 经 过 医生 审核 签字 束 直 接 做 判断 。 但 即使 是 辅助 判断 ， 也 可 以 所 
高 读 片 质量 或 加 快速 度 。 中 国 的 三 甲 医院 每 天 可 能 产生 上 千张 各 种 影 
像 ， 目 前 的 程序 是 先 由 初级 医生 读 片 ， 包 括 在 影像 上 寻找 异 音 位 置 、 
测量 和 记录 ， 初 步 判 断后 把 报告 交 给 资深 医生 审阅 再 做 最 后 判断 。 即 


使 医生 在 每 张 医疗 图 片上 只 花 10 分 钟 时 间 ， 一 名 医生 8 小 时 不 间断 读 片 
也 只 能 读 48 张 片子 ， 一 天 如 果 有 480 张 片子 ， 则 需要 10 位 医生 读 片 。 设 
且 在 一 些 国家 与 地 区 ， 为 了 保证 准确 度 ， 医 生 的 阅 片 数量 被 限定 在 一 
定 范围 内 。 在 三 甲 医院 ， 有 经 验 的 医疗 影像 (例如 放射 科 ) 医生 远 远 
供不应求 。 如 采 人 工 智能 读 片 能 够 把 时 间 从 原来 的 10 分 钟 缩短 到 5 分 
钟 ， 就 可 以 多 读 一 倍 的 图 片 。 由 于 医疗 成 像 设 备 成 本 快速 下 降 ， 起 
声 、X 光 、CT、 核 磁 共 振 以 及 PET 〈 正 电子 发 射 计算 机 上 断层 显 像 ) 等 
设备 正在 广泛 普及 ， 医 学 影像 数据 大 幅度 增长 。 美 国 的 数据 年 增长 率 
达到 了 60%， 但 专业 图 像 医 生 的 增长 率 只 有 2%。 中 国 的 医学 影像 增长 
也 达到 了 30%， 而 医生 的 增长 只 有 4%。 这 意味 看 医生 的 工作 量 大 增 ， 
判断 准确 性 下 降 。 从 影像 方面 的 误诊 人 数 来 看 ， 美 国 的 误诊 人 数 达 到 
了 1 200 万 /年 ， 而 中 国 因为 人 口 基数 庞大 ， 达 到 了 惊人 的 5 700 万 /年 ， 
这 些 误 诊 主要 发 生 在 基层 医疗 机 构 。 


目前 中 国 优质 医疗 资源 高 度 集中 在 大 城市 。 许 多 县 级 以 下 医院 虽 
然 都 有 能 力 添置 更 多 的 医疗 影像 设备 ， 但 严重 缺乏 有 经 验 的 读 厂 医 
生 。 如 果 AI 医 疗 影像 诊断 能 达到 有 经 验 医 生 的 水 平 ， 那 么 通过 网 络 上 
传 读 请 将 大 大 提高 中 国 基层 医疗 机 构 对 疾病 的 诊断 水 平 。 可 以 预见 ， 
未 来 基于 云 服务 的 医疗 影像 识别 判断 将 在 基层 医院 的 影像 识别 和 判断 
上 发 挥 主要 作用 。 一 旦 这 样 的 实验 成 功 ， 将 适用 于 全 世界 所 有 的 发 展 
中 国家 ， 甚 至 很 多 发 达 国 家 。 


从 目前 来 看 ， 人 工 智能 医疗 影像 的 技术 都 是 从 医院 体系 外 部 开始 
的 ， 主 要 由 高 科技 新 创 公 司 提供 技术 和 医院 合作 。 这 些 公司 的 后 台 算 
法 模型 和 计算 能 力 都 大 同 小 异 。 关 键 看 谁 能 从 医院 得 到 更 多 以 往 被 验 
证 过 的 独家 数据 ( 即 用 于 训练 神经 网 络 模型 的 “干净 ”的 已 标注 数 
据 ) 。 这 些 公 司 竞争 的 第 二 个 能 力 束 是 业务 拓展 能 力 和 市 场 策 略 ( 例 
如 专攻 三 甲 医院 还 是 面向 基层 ) 。 在 这 个 领域 未 来 可 能 出 现 一 些 新 的 
商业 模式 ， 例 如 当 技 术 成 熟 时 设立 一 家 专门 的 医疗 影像 识别 判断 机 
构 ， 专 门 为 大 量 的 基层 医院 提供 外 包 服 务 。 这 样 的 趋势 也 将 影响 医学 
院 的 课程 设置 和 培养 学 生 的 方 同 。 


发 现 狐 约 


AI 在 医疗 健康 领域 的 第 二 个 重要 应 用 是 制 药 。 小 分 子 化 合 物 新 药 
发 现 的 简单 原理 是 找到 一 种 化 合 物 的 分 子 结构 能 够 和 要 “对 付 ” 的 生化 
目标 (例如 癌症 细胞 中 的 某 种 蛋 日 质 或 被 病毒 攻击 的 人 体 正常 蛋 日 
质 ) 发 生 反 应 ， 激 活 或 抑制 目标 蛋白 质 的 某 些 功能 。 传 统 的 发 现 新 药 
的 方法 是 试 错 ， 像 爱迪生 发 明 铝 丝 灯泡 一 样 试验 成 干 上 万 种 不 同 的 化 
合 物 。 但 是 这 种 试 错 法 成 本 极 高 ， 因 为 筛选 出 一 个 新 药 的 备 选 化 合 物 
要 做 大 量 的 实验 ， 还 要 逐一 比较 该 化 合 物 的 有 效 性 和 毒 副 作用 等 。 如 
图 5.10 所 示 ， 世 界 大 药 研 发 一 舱 新 药 的 费用 在 2010 年 已 经 达到 26 亿 
美元 ,今天 早已 大 大 超过 这 个 数额 。 其 中 临床 前 阶段 超过 10 亿 美元 ， 
这 10 亿 类 元 主要 是 用 于 初期 的 入 选 和 试 错 。 从 大 量 的 化 合 物 中 猎 选 出 
备 选 化 合 物 直 到 最 后 优化 出 新 药 不 仅 耗资 巨大 ， 而 且 过 程 长 达 数 年 。 
( 百 万 美元 ) 
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图 5.10 不 同年 代 新 药 的 研发 成 本 


数据 来 源 : Tufts Center for the Study of Drug Development，CSDD。 


在 基于 深度 学 习 的 人 工 智能 成 熟 之 前 ， 新 药 研 发 已 经 广泛 使 用 计 
算 机 辅助 制药 。 根 据 人 类 已 有 的 生化 知识 ， 例 如 备 选 化 合 物 以 及 目标 
分 子 结构 和 特性 ， 计 算 机 可 以 通过 建立 模型 来 模拟 化 合 物 和 目标 蛋白 
质 的 生化 反应 ， 从 而 减少 实验 和 缩短 时 间 。 传 统 的 计算 式 新 药 发 现 可 
以 说 是 建立 在 对 分 子 结构 理解 基础 上 的 “ 白 箱 操作 ”模式 。 而 基于 深度 
学 习 的 痢 药 发 现 则 是 一 种 "黑箱 操作 ”模式 。 在 “黑箱 操作 ”模式 下 ， 计 
算 机 并 不 需要 建立 化 合 物 的 分 子 结构 模型 ， 甚 至 不 需要 了 解 备 选 化 合 
物 及 生化 目标 的 特性 ， 而 只 需要 有 大 量 的 已 有 化 合 物 和 已 研究 过 的 生 
化 目标 之 间 的 生化 反应 数据 。 用 这 些 已 有 数据 来 训练 神经 网 络 模型 ， 
训练 好 的 深度 学 习 算 法 可 以 在 很 短 的 时 间 里 从 大 量 不 同化 合 物 中 筛选 
出 可 能 有 用 的 备 选 化 合 物 。 这 里 被 策 选 的 大 量化 合 物 也 不 是 随机 产生 
的 ， 完 全 可 以 根据 人 类 已 有 的 知识 用 计算 机 模型 产生 那些 可 能 性 比较 
大 的 化 合 物 。 同 样 的 原理 ， 在 备 选 化 合 物 进一步 被 般 选 时 ， 例 如 进行 
化 合 物 的 生物 可 利用 性 、 代 谢 半 袁 期 和 毒 副 作用 的 实验 时 ， 仍 然 可 以 
用 已 有 的 数据 进行 识别 和 和 角 选 。 这 个 原理 类 似 一 个 有 经 验 的 媒 姿 ， 当 
媒 北 和 拿 到 一 个 要 找 对 象 的 小 伙 子 的 资料 时 ， 媒 婆 根 据 小 伙 子 的 长 相 、 
身高 、 脾 气 、 职 业 、 收 入 等 在 目 己 的 记忆 中 寻找 类 似 的 小 伙 子 成 功 配 
对 的 案例 ， 束 能 八 九 不 离 十 地 给 他 介绍 一 个 有 和 硕 望 成 功 的 姑娘。 目前 
硅谷 和 欧洲 已 经 有 几 家 用 深度 学 习 发 现 新 药 的 公司 ， 如 位 于 旧金山 的 


Atomwise。 


诊断 与 监测 


AI 在 医疗 健康 领域 的 第 三 个 重要 的 应 用 是 基于 医疗 大 数据 的 诊 
断 、 预 测 和 健康 监测 。 医 疗 诊断 的 挑战 在 于 : 第 一 ， 人 体 是 一 个 复杂 
的 系统 ; 第 二 ， 所 谓 “ 同 一 种 疾病 ?其 实在 每 个 个 体 身 上 都 有 很 大 的 不 
同 ， 例 如 当 一 个 患者 血糖 高 时 ， 可 能 影响 到 心 、 肝 、 脾 、 肺 、 则 、 胰 
甩 等 多 个 絮 官 ， 不 同 的 患者 影响 不 同 。 即 使 十 很 有 经 验 的 医生 也 很 难 


考虑 得 很 周全 ， 特 别 是 优质 医疗 货源 暴 张 的 地 方 ， 例 如 中 国 的 北京 、 
上 海 等 地 ， 门 诊 医生 能 伦 在 每 个 患者 身上 的 诊断 时 间 只 有 几 分 钟 ， 医 
生 只 能 根据 经 验 和 患者 的 情况 做 一 个 大 致 的 疾病 分 类 判断 ， 而 基于 人 
工 智能 的 诊断 可 以 做 精细 化 的 诊断 。 第 一 步 是 收集 整理 患者 的 数据 ， 
包括 各 类 化 验 和 检查 结果 、 患 者 主诉 和 医生 判断 。 将 这 些 数据 整理 和 
清洗 ( 殊 除 明显 错误 或 无 关 数 据 后 ， 将 各 类 病症 的 相关 性 整理 出 
来 。 图 5.11 是 硅谷 AI 医疗 诊断 公司 CloudMedx 关 于 各 种 疾病 症状 之 间 的 
相关 图 。 图 中 的 每 一 个 节点 都 是 某 类 特定 患者 (特定 性 别 、 年 龄 、 种 
族 等 ) 的 某 种 症状 。 市 点 之 间 的 连 线 是 两 种 症状 之 间 的 相关 性 ， 收 集 
的 患者 数据 量 越 大 ， 节 点 束 越 多 ， 相 关 性 束 越 准确 。 这 种 超级 相关 图 
忠 可 以 是 深度 学 习 里 面 的 用 于 训练 机 絮 模 型 的 已 标注 数据 。 一 旦 一 个 
新 的 病例 数据 输入 机 妖 中 ， 机 器 束 可 以 蕊 上 根据 已 有 的 数据 做 出 一 个 
比 有 经 验 的 医生 还 准确 的 判断 。 


图 5.11 疾 病症 状 之 间 相 关 性 的 超级 链接 


图 片 来 源 : CloudMedx Inc.。 

同样 的 原理 也 适用 于 疾病 的 预测 和 预防 。 医 生 有 很 多 工具 预测 患 
者 的 健康 状况 ， 但 他 们 也 经 芝 被 人 体 复 杂 性 所 难 倒 ， 苞 其 是 心脏 病 发 
作 是 很 难 预料 的 。 现 在 ， 科 学 家 已 经 证 明 能 够 运用 人 工 智能 实现 比 标 
准 的 医疗 指南 更 有 效 的 预测 ， 能 大 大 提高 预测 的 准确 率 。 目 前 ， 各 国 
的 科学 家 已 经 在 大 脑 疾 病 、 心 脏 疾病 、 慢 性 病 、 心 脏 病 、 骨 关 市 疾 
病 、 流 行 病 等 的 预测 研究 上 取得 较 好 的 成 果 。 随 着 这 些 方法 的 进一步 
成 束 和 落地 ， 每 年 可 以 挽救 数 百 万 人 的 生命 。 


每 年 有 将 近 2 000 万 人 死 于 心血 管 疾病 ， 包 括 心 脏 病 、 中 风 、 动 脉 
阻塞 和 其 他 循环 系统 功能 障碍 。 许 多 医生 使 用 类 似 美国 心脏 病 学 会 / 美 
国 心脏 协会 (ACC /AHA) 的 指南 预测 这 些 病 例 。 这 些 指南 基于 年 
龄 、 胆 固 醇 水 平和 血压 等 八 个 风险 因素 ， 经 过 医生 有 效 玛 加 进行 预 
测 。 但 这 种 方式 太 简 单 了 ， 不 能 涵盖 患者 可 能 使 用 的 许多 药物 ， 或 者 
其 他 疾病 和 生活 方式 等 因素 。 并 且 一 些 因素 的 影响 是 违反 人 类 直觉 
的 。 英 国 诺丁汉 大 学 的 流行 病 学 家 斯 带 芬 - 癸 (Stephen Weng) 说 :“ 生 
物 系 统 中 有 很 多 因素 相互 影响 。 在 某 些 情况 下 ， 大 量 的 脂肪 实际 上 可 
以 预防 心脏 病 。” 例 和 他 的 团队 使 用 了 四 种 机 器 学 习 算 法 ， 以 便 发 现 病 
历 记 录 和 心血 管 疾病 之 间 的 关联 ， 他 们 基于 英国 378 256 名 患者 的 电子 
病历 训练 了 人 工 智能 模型 。 与 ACC / AHA 指 南 不 同 ， 机 器 学 习 方法 考 
虑 了 22 个 影响 因素 ， 包 括 种 族 、 关 节 炎 和 肾脏 疾病 等 。 利 用 2005 年 的 
记录 数据 ， 他 们 预测 在 未 来 十 年 内 哪些 患者 会 有 第 一 次 心血 管 发 病 事 
件 ， 并 对 2015 年 的 记录 进行 预测 。 四 种 机 器 学 习 方 法 的 表现 明显 好 于 
ACC/AHA 指 南 ， 通 过 AUC 的 统计 方法 (得 分 为 1 意味 着 100% 的 准确 
率 ) ，ACC/AHA 指 南 得 分 是 0.728。 这 四 种 机 器 学 习 方 法 的 得 分 介 于 
0.745~0.764。 最 好 的 一 个 神经 网 络 比 ACC/AHA 方 法 准确 率 高 7.6%， 
并 且 它 减少 了 1.6% 的 误 报 ， 在 大 约 83 000 条 记录 的 测试 样本 中 相当 于 
可 以 多 挽救 355 名 患者 的 生命 。 合 说 这 是 因为 预测 结果 可 以 通过 降低 胆 
固 醇 的 药物 或 改变 饮食 来 预防 。 这 个 研究 发 现 ， 机 器 学 习 算法 认定 的 
最 强 预 测 因素 没有 被 ACC /AHA 指 南 赛 括 ， 例 如 严重 的 精神 疾病 和 口 
服 皮质 类 固 醇 。 同 时 ，ACC/AHA 列 表 中 没有 一 种 算法 将 糖尿 病 列 入 前 
10 名 预测 指标 。 翁 希望 在 后 续 的 研究 中 算法 能 包含 其 他 生活 方式 和 遗 
传 因 素 ， 以 便 进 一 步 提 高 其 准确 性 。 

另 一 个 通过 人 工 智能 预测 心脏 疾病 的 研究 机 构 也 取得 了 很 好 的 将 
果 。 英 国医 学 研究 委员 会 下 的 MRC 伦 敦 医 学 科学 研究 所 称 ， 人 工 智能 
软件 通过 分 析 血 液 检 测 结果 和 心脏 扫描 结果 ， 可 以 发 现 心脏 即将 衰竭 
的 迹象 。 研 究 人 员 发 现 肺 内 血压 的 增高 会 损害 部 分 心脏 ， 大 约 1/3 的 患 
者 会 在 确诊 之 后 的 五 年 内 死亡 。 目 前 的 治疗 方法 主要 是 直接 将 药物 注 


射 到 血管 以 及 肺 移植 ， 但 是 ， 医 生 需 要 知道 患者 还 能 活 多 和 久 ， 以 便 选 
择 正 确 的 治疗 方案 。 研 究 人 员 在 人 工 智能 软件 中 录入 了 256 名 心脏 病 患 
者 的 心脏 核磁 共振 扫描 结果 和 血液 测试 结果 。 软 件 测量 了 每 一 次 心跳 
中 ， 心 脏 结 构 上 标记 的 3 万 个 点 的 运动 状况 ， 把 这 个 数据 与 患者 八 年 来 
的 健康 记录 相 结 合 ， 人 工 智 能 软件 就 可 以 预测 哪些 异常 状况 会 导致 患 
者 的 死亡 。 人 工 智能 软件 能 够 预测 未 来 五 年 的 生存 情况 ， 预 测 患 者 存 
活期 只 有 一 年 的 准确 率 大 约 为 80%， 而 医生 对 于 这 个 项 目的 预测 准确 
率 为 60%。 


目前 世界 上 超过 5 亿 人 患 有 不 同 的 肯 脏 疾 病 ， 但 是 全 社会 对 于 慢性 
肾病 的 知晓 率 不 足 10%， 因 为 慢性 肾病 早期 没有 明显 的 症状 ,很 容易 
被 忽视 ， 很 多 患者 等 到 肾 功能 有 恶 化 时 才 去 束 医 ， 因 此 肾病 分 级 预警 古 
件 很 急迫 的 事情 。 华 南 农业 大 学 食品 学 院 的 研究 员 曾 经 基于 人 工 智 
能 对 肾 小 球 过 滤 进 行 预测 ， 通 过 神经 网 络 构造 了 预测 模型 ， 从 而 最 终 
构建 出 一 个 实用 性 民 好 的 慢性 肯 病 分 型 预警 模型 。 


医疗 健康 诊断 和 预测 是 一 个 典型 的 上 暗 知识 案例 。 一 个 疾病 的 原因 
非常 复杂 ， 每 个 病人 的 身体 情况 和 病史 又 都 不 同 。 人 生活 在 一 个 超级 
复杂 的 环境 中 ， 环 境 中 的 所 有 因素 都 对 人 的 健康 有 影响 。 过 去 的 医疗 
教育 是 把 这 些 非常 复杂 的 情况 大 大 简化 ， 编 写成 各 种 教科 书 和 指南 ， 
但 这 些 明知 识 根本 无 法 履 盖 所 有 的 情况 ， 所 以 一 个 好 的 医生 主要 是 通 
过 多 年 实践 掌握 7 了 大量 的 默 知 识 。 但 由 于 人 体 的 复 洒 性 ， 每 个 医生 掌 
握 的 默 知 识 只 是 一 点 皮毛 ， 无 论 古 广度 和 深度 都 远 远 不 够 。 只 有 机 器 
学 习 才 能 系统 地 通过 数据 挖 据 出 大 量 复杂 的 ， 医 生 通 过 自己 经 答 和 理 
解 都 无 法 触及 的 瞳 知 识 。 这 些 数据 不 仅 包 括 病人 的 数据 ， 也 包括 生 
物 、 药 理 、 生 理 、 和 气候、 环境 等 数据 ， 机 硕 能 在 这 些 复杂 的 数据 中 找 
出 隐蔽 的 相关 性 。 机 器 将 发 现 越 来 越 多 的 医疗 健康 方面 的 瞳 知识 ， 这 
不 仅 将 从 根本 上 改变 未 来 的 医疗 诊断 ， 也 将 深刻 影响 未 来 的 医学 教育 
和 医生 培养 。 


健康 管理 


健康 管理 是 AI 在 医疗 领域 的 第 四 个 重要 应 用 。 移 动 智能 终端 与 移 
动 互 联网 的 发 展 让 人 们 越 来 越 多 的 行为 以 数字 化 的 方式 被 记录 下 来 ， 
包括 医疗 就 诊 、 饮 食 营 养 、 运 动 状况 、 睡 眠 时 间 、 社 交 、 生 命 体征 等 
数据 。 而 人 工 智能 将 逐步 让 这 些 数 据 释 放出 它们 应 有 的 价值 ， 基 于 数 
所 的 分 机， 提供 更 为 健康 的 生活 方式 ， 通 过 帮助 人 们 管理 摄 入 饮食 的 
避 状 成分、 生活 方式 、 精 神情 绪 等 ， 让 健康 群体 对 目 身 的 健康 实现 更 
具 前 上 脆性 的 管理 和 风险 预测 ， 让 亚 健康 和 正在 康复 的 群体 获得 更 好 的 
恢复 方案 。 


Virta Health 是 由 加 利 福 尼 亚 大 学 戴 维 斯 分 校医 学 院 的 教授 斯 蒂 芬 . 
菲 尼 (Stephen Phinney) 博士 和 俄亥俄 州立 大 学 的 教授 术 夫 : 沃 莱克 
(Jeff Volek) 共同 创办 的 一 家 互联 网 慢性 病 管理 平台 。Virta Health 的 
技术 平台 运用 了 AI 技术 ， 在 其 医生 和 健康 咨询 师 团队 的 辅助 下 ， 提 供 
连续 和 实时 的 医疗 支持 ， 并 能 提出 精准 的 饮食 方案 ， 为 患者 设计 出 个 
体 化 的 碳水 化 合 物 摄 入 和 饮食 方案 。 当 患者 注册 成 为 Virta Health 的 会 
员 后 ， 它 会 寄 给 患者 一 套 经 过 FDA 认 证 的 医疗 设备 ， 用 于 每 日 血糖 、 
血压 和 体重 等 身体 指标 的 监测 。 在 监测 完成 后 ， 医 生根 据 当 天 的 各 项 
数据 ， 通 过 人 工 智能 的 计算 给 患者 制定 出 个 性 化 的 饮食 方案 。Virta 
Health 还 设立 了 健康 教练 的 职位 ， 向 患者 提供 一 对 一 的 咨询 服务 ， 如 
果 是 在 非 工 作 时 间 ， 那 么 语音 机 器 人 可 以 给 患者 回答 一 些 答 案 标准 度 
高 的 医学 问题 。 此 外 ， 患 者 可 以 选择 加 入 在 线 社 区 ， 与 其 他 病友 分 享 
治疗 心得 ， 互 相 激励 。Virta Health 与 印第安 纳 大 学 医学 院 于 2016 年 开 
始 针对 262 位 | 型 糖尿 病 患者 展开 为 期 两 年 的 试验 ， 前 十 周 就 已 经 取得 
了 让 人 振奋 的 治疗 效果 。87% 的 患者 减少 胰岛 素 的 注射 量 ，56% 的 患 
者 糖化 血红 蛋白 含量 降 至 健康 水 平 ，75% 的 患者 体重 至 少 减少 了 5% 。 


美国 公司 Realeyes 使 用 计算 机 视觉 、 机 右 学 习 技 术 ， 通 过 电脑 或 
智能 手机 摄像 头 跟 踩 用 户 面 部 表情， 评估 用 户 的 情绪 变化 。 目 前 ， 


Realeyes 已 经 建立 了 超过 500 万 帧 的 人 脸 数据 库 。 每 一 帧 都 有 多 达 7 个 
面部 动作 注解 ， 比 如 皱眉 意味 大 困惑 ， 而 眉毛 向 上 抬 起 则 表示 惊讶 。 
此 外 还 会 有 其 他 面部 特征 帮助 一 起 进行 情绪 识别 ， 使 分 析 结 果 更 有 说 
服 力 。Realeyes 正 在 研发 一 款 心 理 健 康 产 品 ， 以 便 帮 助人 们 变 得 快乐 
并 且 保 持 快乐 。 

随 着 智能 手机 、 可 穿戴 设备 中 传 感 咒 的 丰富 ， 这 些 设备 已 经 可 以 
获取 用 户 在 不 同 场景 中 的 运动 数据 (跑步 、 瑜 如、 游泳 等 ) ， 睡 眠 质 
量 、 血 糖 、 心 率 、 心 电 岁 、 血 氧 等 数据 ， 以 及 生活 场景 中 的 寓 度 、 拼 
气 、 紫 外 线 等 数据 ， 从 而 为 人 工 智能 更 健康 地 管理 人 们 的 生活 提供 更 
全 面 精 准 的 资料 。 


医疗 语音 助理 


AI 在 医疗 领域 的 第 五 个 重要 应 用 是 医疗 语音 助理 。 医 疗 语音 助理 
目前 已 经 在 病历 孙 入 、 智 能 导 医 、 推 荐 用 药 等 环 世 开始 商用 ， 帮 助 医 
生 减 轻 工 作 压力 ， 提 升 患者 的 束 医 体验 。 


病历 书写 花费 了 医生 相当 多 的 时 间 。 据 香 洪 德 信 2016 年 调查 数据 
显示 ， 中 国 50% 以 上 的 住院 医生 平均 每 天 用 于 写 病 历 的 时 间 超 过 4 个 
小 时 ， 相 当 一 部 分 医生 写 病 历 的 时 间 超 过 7 个 小 时 。 而 语 首 助理 则 能 够 
大 幅 减 少 写 病历 所 用 的 时 间 ， 医 生 的 口述 内 容 可 以 实时 转 写 成 文本 ， 
录入 到 医院 信息 管理 软件 中 。 了 录入 病历 的 效率 提高 以 后 ， 医 生 能 够 拥 
有 更 多 时 间 问 诊 。 对 放射 科 等 特殊 科室 的 医生 来 说 更 是 效果 明显 。 放 
射 科 医 生 大 多 需要 在 2 个 屏幕 间 来 回 切换 ， 一 会 看 片子 ， 一 会 进行 报告 
记录 ， 有 了 语音 录入 ， 可 以 把 注意 力 放 在 片子 上 ， 边 看 边 说 ， 工 作 更 
加 流畅 ， 效 率 也 大 大 提高 。2016 年 8 月 ， 北 京 协 和 医院 在 病房 、 手 术 
室 、 超 声 科 、 放 射 科 等 全 部 上 线 “ 医 疗 智能 语音 录入 系统 ”"， 成 为 首 家 
文 持 语音 识别 的 公立 三 甲 医院 ， 这 套 系 统 的 语音 识别 准确 率 达 到 959% 
以 上 上， 个别 科室 的 准确 率 更 是 超过 989% 。 


美国 语音 技术 公司 Nuance 推 出 的 虚拟 助手 Florence， 更 是 能 在 一 定 
程度 上 理解 医生 口述 文件 ， 并 通过 洞察 发 现 来 提供 及 时 的 建议 ， 例 如 
药物 、 实 验 室 或 做 CT 的 订单 等 。Nuance 的 报告 显示 ，Florence 在 试点 
阶段 惑 为 医生 节省 了 35% 的 时 间 ， 而 现在 与 优化 之 前 相 比 和 省 的 时 间 
超过 了 50%。 该 系统 还 将 20 个 订单 的 键 击 总 数 从 87 次 减少 到 零 。 
Nuance 表 示 ， 这 意味 着 仅仅 在 美国 的 药学 、 放 射 学 和 实验 室 订 单方 
面 ， 一 年 瓯 为 医生 节省 了 2 260 万 个 小 时 。 


和 肴 能 导 诊 机 器 人 也 开始 在 医院 中 应 用 。 路 过 大 党 的 医生 或 服务 台 
人 员 经 第 被 患者 问 询 该 挂 哪个 科室 的 号 ， 有 无 主任 医师 ， 以 及 洗手 
间 、 开 水 房 的 位 置 。 数 据 显示 ， 目 前 中 国 一 家 三 甲 医院 的 日 门诊 总 量 
平均 约 为 6000 人 次 ， 即 便 10% 的 患者 问 询 这 些 问题 ， 也 将 给 医院 市 来 
较 大 压力 ， 并 且 由 于 分 属 不 同 的 科室 和 专业 知识 的 局 限 ， 被 问 询 的 医 
生 或 护士 很 难 精准 地 回答 。 而 状 能 问 诊 机 右 人 在 云端 和 医院 的 各 个 系 
统 以 及 服务 丙 的 知识 库 相 接 ， 能 够 通过 语 首 或 显示 屏 轻 松 准 确 地 解 管 
大 多 数 问 题 ， 并 且 这 些 导 诊 机 絮 人 还 能 听 慌 不 同 的 方言 和 外 语 ， 能 够 
解决 该 类 人 群 沟通 不 畅 的 问题 。 目 前 ， 科 大 讯 飞 的 机 器 人 “上 晓 受 ”、 进 
化 者 机 器 人 公司 的 机 器 人 “小 胖 ” 已 经 开始 在 北京 、 武 汉 等 地 的 医院 提 
供 服务 。 ( 见 图 5.12) 


图 5.12 北 京 301 医 院 门诊 大 厅 内 的 智能 导 诊 机 器 人 


图 片 来 源 : 中 新 网 。 

还 有 一 个 语音 辅助 医疗 的 例子 是 荷兰 一 家 创业 公司 开发 的 接线 辅 
助 智 能 系统 Corti。 该 系统 能 够 根据 患者 提供 的 信息 和 说 话 声音 ， 识 别 
患者 的 症状 ， 回 急救 专业 人 员 进 行 提 示 ， 并 且 能 够 提醒 接线 员 询 问 更 
为 详细 的 信息 。2016 年 12 月 ， 接 线 员 推断 一 名 男士 在 事故 中 摔 倒 ， 被 
损坏 的 屋顶 磺 到 了 背部 ， 此 时 ，Corti 开 启 了 声音 识别 模式 ， 它 听 到 了 
微弱 的 震动 声 ， 患 者 虽然 心脏 又 停 但 还 在 试 着 呼吸 ，Corti 准 确 识 别 了 


这 个 场景 。 


智能 金融 将 导致 一 大 批 日 领 、 金 领 失业 


AI 将 给 金融 行业 市 来 彻 展 的 颠覆 。 人 金融 行业 的 重要 分 文 例 如 银 
行 、 保 险 、 证 券 、 理 财 将 无 一 幸免 。 


限行 


全 球 银 行业 正在 受到 金融 科技 的 巨大 冲击 。 据 埃 森 哲 调 研 数据 显 
示 ， 消 费 者 正 以 每 年 两 位 数 的 增长 速度 从 传统 银行 迁移 到 互联 网 金 
融 。 超 过 一 半 的 调研 者 认为 目前 银行 基于 互联 网 金融 的 业务 收入 占 比 
低 于 10%“。 换 和 森 哲 预测 到 2020 年 银行 业 将 有 近 30% 的 营业 收入 受到 影 
响 。 

人 工 智能 技术 作为 金融 科技 的 核心 技术 ， 正 在 使 银行 业 的 服务 形 
态 、 数 据 处 理 、 需 求 洞察 、 风 险 管理 等 发 生根 本 性 的 变革 。 

首先 ， 银 行 面 对 消费 者 的 大 量 业 务 和 服务 将 被 AI 取 代 。 例 如 贷款 
的 审核 方面 ， 人 工 智能 可 以 在 贷 前 、 贷 中 、 贷 后 进行 客户 跟 踩 管理 。 
根据 银行 的 征 信 数据 加 上 社交 的 数据 行为 特征 ， 可 以 精准 地 摘 述 个 人 
行为 和 金融 风险 。 一 笔 贷 蒜 的 申请 和 审核 可 以 在 瞬间 完成 ， 并 且 比 人 
工 审 核 的 坏账 率 更 低 。 以 前 银行 做 小 额 信 贷 很 少 ， 因 为 风险 太 大 ， 损 
失 率 太 高 ， 现 在 因为 人 工 智 能 和 大 数据 ， 小 额 信贷 开始 蓬 动 发 展 。 再 
比如 客服 方面 ， 汇 丰 银 行 、 恒 生 银 行 、 中 国平 安 银行 等 都 推出 了 智能 
语 首 客服 ， 采 用 了 上 自然 语言 处 理 技术 ， 能 够 回答 客户 的 提问 。 根 据 美 
国 市 场 调查 公司 Juniper Research ( 朱 尼 普 人 研究 公司 ) 测算 ， 与 传统 的 
呼叫 中 心 调查 相 比 ， 一 个 聊天 机 器 人 的 回答 将 节省 大 约 4 分 钟 。 预 计 到 
2022 年 ， 聊 天 机 絮 人 将 帮助 全 球 银 行 每 年 广 省 80 亿 美元 。 

其 次 ，AI 将 取代 银行 内 部 的 大 量 人 工 运营 管理 工作 。 大 型 银行 必 
须 处 理 大 量 的 数据 以 便 生 成 财务 报告 ， 并 满足 合 规 要 求 。 这 些 过 程 都 
越 来 越 规范 化 、 程 式 化 ， 但 仍 需要 大 量 人 员 进 行 添加 任务 ， 比 如 对 账 
和 合并 报表 ， 他 们 的 工作 是 机 器 人 过 程 自动 化 (RPA) 的 理想 选择 。 


不 仅 如 此 ， 在 搂 下 来 的 几 年 中 ， 人 工 智能 将 被 用 于 改变 财务 中 基 
核心 的 功能 ， 例 如 公司 间 对 账 和 季报 ， 以 及 进行 财务 分 析 、 合 规 分 析 
等 更 具有 战略 性 的 职能 。AI 提 供 了 速度 和 准确 性 ， 例 如 ， 整 个 报告 和 
披露 过 程 可 以 和 真实 时 间 基 本 保持 同步 ， 不 用 再 等 到 每 个 季度 末期 。 
由 AI 文 撑 的 财务 团队 能 够 比 现在 更 快 地 发 现 问 题 并 做 出 调整 ， 从 而 拓 
高 准确 性 ， 而 非 每 个 季度 的 最 后 阶段 才 做 努力 。 例 如 英国 的 Suade 公 司 
合 规 平 人 台 能 够 满足 银行 时 刻 审慎 的 监管 政策 ， 该 乎 台 能 够 目 动 通过 数 
据 整理 生成 监管 报告 。 


风险 控制 对 银行 业 来 说 非常 重要 。 整 体 的 风 探 方面 也 开始 引入 越 
来 越 多 的 算法 。 以 前 银行 的 首席 风险 官 主 要 双 盯 资产 负债 表 来 控制 风 
险 ， 而 当前 随 着 数据 维度 的 增加 ， 人 负债 表 、 收 益 表 、 库 存 、 流 量 、 企 
业 的 经 营 状 况 都 被 纳入 其 中 ， 并 且 实 时 跟踪 控 据 ， 不 用 等 到 资产 负债 
表 出 来 再 进行 调整 模型 ， 整 个 风险 的 管控 精准 度 比 以 前 大 大 提高 

银行 业 也 正在 借助 算法 来 避 选 人 才 ， 同 时 减少 跳槽 员工 的 数量 。 
德意志 银行 2016 年 9 月 面 癌 部 分 美国 大 学 毕业 生 司 用 一 套 饰 选 系统 ， 该 
系统 由 一 家 硅谷 公司 Koru 设 计 。 参 与 德意志 银行 美国 企业 融资 职位 的 
候选 人 要 完成 该 系统 20 分 钟 的 行为 测验 ， 以 便 选 取 和 公司 表现 最 佳 的 
初级 员工 有 类 似 叫 诚 度 的 员工 。 负 责 该 项 目的 德意志 银行 董事 总 经 理 
诺 埃 尔 . 沃 尔 普 (Noel Volpe) 表示 ， 该 系统 下 在 发 现 * 具 备 我 行 最 优 
秀 、 最 聪明 人 才 映 上 的 某 些 特征 的 候选 人 。 他 相信 ， 与 各 银行 通常 苋 
相 争 寺 的 利 青 腾 大 学 候选 人 相 比 ， 新 的 测验 识别 出 的 招聘 对 象 将 更 适 
合 该 行 ， 因 为 党 青 防 大 学 的 毕业 生 往 往 没 有 忠诚 意识 。 伦 旗 集 团 、 高 
盛 也 在 试 运行 目 己 的 版 本 。 

面 对 金 融 科技 融 来 的 竞争 力 和 紧迫 感 ， 银 行 除了 变 半 业务 架构 和 
将 技术 融入 业务 之 中 ， 一 定 要 重视 目 身 的 天 然 优 势 一 一 既 有 的 用 户 和 
数据 。 有 寿 肯 锡 研 究 报 告 以 银行 业 为 例 指 出 ， 银 行业 每 产生 100 万 美元 的 
收入 ， 束 会 产生 820GB 的 数据 。 人 金融 行业 在 发 展 的 过 程 中 积 素 了 大 量 
的 数据 ， 包 括 客 尸 信息 、 交 易 信息 、 资 产 负 债 信息 等 。 


图 5.13 是 不 同行 业 每 产生 100 万 美元 收入 所 产生 的 数据 量 。 随 着 软 
件 功 能 的 增强 和 传感器 成 本 的 降低 ， 单 位 收入 所 产生 的 数据 还 会 大 大 
增加 。 


交易 信息 、 账 户 信 息 、 身 份 特征 信息 和 行为 数据 构成 了 未 来 金融 
业 基 础 核心 数据 的 金 矿 。 截 至 目前 ， 包 括 网 络 银行 所 用 的 数据 在 内 ， 
银行 业 使 用 的 数据 只 占 现 存 数据 的 不 到 10%。 银 行 只 有 结合 用 户 在 互 
联网 上 的 行为 特征 ， 深 度 挖掘 既 有 的 数据 ， 才 能 更 好 地 掌握 和 吸引 用 
户 ， 并 为 他 们 带 来 更 好 的 服务 体验 。 
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电信 460 
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图 5.13 不 同行 业 每 产生 100 万 美元 收入 所 产生 的 数据 量 
图 片 来 源 : 麦肯锡 报告 。 


保险 


以 人 工 智能 、 大 数据 、 区 块 链 等 技术 为 核心 的 nsurTech (保险 科 
技 ) 正在 重新 定义 保险 产业 。 保 险 业 务 从 产品 设计 ， 售 前 《咨询 、 推 
荐 、 关 怀 ) ， 承 保 (认证 、 核 保 、 定价 ) ， 理 赔 〈 反 欺诈 、 核 损 、 赔 


付 ) ， 售 后 服务 《客服 、 日 常 分析、 客户 关系 管理 ， 以 及 营销 和 风 
险 探 制 方面 都 在 重 构 。 


在 产品 创新 方面 ， 通 过 AI 可 以 精准 发 掘 潜在 的 保险 需求 ， 提 供 定 
制 化 保险 产品 。 旧 金山 的 一 家 汽车 保险 公司 Metromile 打 破 传统 车 险 的 
国定 收费 模式 ， 利 用 手机 App (应 用 程序 ) 及 大 数据 运算 掌握 用 户 的 
开车 里 程 数 ， 并 根据 收集 到 的 资料 实施 定制 化 收费 ， 让 用 户 根据 开车 
行为 及 情况 更 公平 地 支付 保费 。Metromile 认 为 65% 的 车 主 都 支付 了 过 
高 的 保费 以 便 补贴 少数 开车 最 多 的 人 ， 因 此 它们 抓 住 传统 车 险 模式 中 
的 这 个 痛 点 ， 推 出 按 量 计 费 的 新 形态 车 险 ， 实 现 里 程 维 度 上 的 个 性 化 
定价 。Metromile 提 供 的 车 险 由 基础 费用 和 按 里 程 变动 费用 两 部 分 组 
成 。 其 计算 公式 为 每 月 保费 总 额 = 每 月 基础 保费 + 每 月 行车 里 程 x 单 位 
里 程 保费 。 其 中 基础 保费 和 单位 里 程 保费 会 根据 不 同 车 主 的 情况 有 所 
不 同 (如 年 龄 、 车型、 驾车 历史 等 ) ， 基 础 保费 一 般 在 15~40 美 元 ， 按 
里 程 计 费 的 部 分 一 般 是 2~6 美 分 / 英里 。Metromile 还 设置 了 保费 上 限 ， 
当日 里 程 数 超过 150 英 里 (华盛顿 地 区 是 250 英 里 ) 时 ， 超 过 的 部 分 不 
需要 再 多 交 保 费 。2017 年 特 斯 拉 也 宣布 今后 将 自己 提供 汽车 保险 。 因 
为 特 斯 拉 有 每 辆 车 的 驾驶 数据 ， 它 可 以 为 每 辆 车 制定 个 性 化 保险 产 
品 ， 这 样 的 “保险 精算 "是 任何 传统 保险 公司 都 望尘莫及 的 。 

保险 营销 创新 ， 现 在 通过 大 数据 的 应 用 ， 平 台 可 以 对 数据 进行 比 
较 ， 帮 助 客户 选择 保险 。 比 如 有 一 款 应 用 Denim， 为 保险 公司 提供 社 
交 推 广 平台 ， 通 过 数据 分 析 为 保险 公司 精确 引流 客户 。 

保险 管理 平台 的 创新 ， 比 如 Apliant 就 是 一 家 为 代理 人 提供 管理 平 
台 的 软件 ， 提 高 代理 人 的 服务 效率 以 及 服务 水 平 。 


在 承保 方面 ， 南 非 农 业 数 据 分 析 平 台 Aerobotics 公 司 通过 无 人 机 来 
获取 农业 、 物 流 、 矿 产 等 行业 的 数据 ， 以 此 来 评定 风险 等 级 ， 提 升 公 
司 效率 。 硅 谷 的 财产 保险 公司 Cape Analytics 则 是 利用 机 器 学 习 和 高 空 
摄像 技术 来 为 投保 人 的 财产 进行 风险 等 级 测评 。 其 高 空 成 像 技术 可 以 
兮 测 出 不 同 的 时 间 内 ， 同 一 空间 内 物体 的 改变 情况 。 


在 理赔 方面 ，2017 年 6 月 ， 蚂 蚁 金 服 基于 图 像 识 别 检测 技术 与 人 工 
智能 推出 了 “ 定 损 宝 *"， 只 需 按 要 求 将 拍摄 的 照片 上 传 ， 定 损 宝 就 能 用 
云端 服务 器 的 算法 模型 根据 用 户 上 传 的 图 片 进行 判定 ， 生 成 解决 方 
案 ， 该 类 产品 能 够 在 理赔 服务 流程 中 降低 成 本 。 目 前 在 保险 业 中 ， 约 
有 10 万 人 从 事 查 勘定 损 的 工作 。 实 现 自动 定 损 之 后 ， 预 计 可 以 减少 查 
勘定 损人 员 50% 的 工作 量 。 美 国 财 产 保险 公司 Dropin 更 是 开发 了 一 个 
直播 平台 ， 保 险 公司 可 以 从 无 人 机 或 用 户 手 机 端 获 取 事故 现场 的 实时 
视频 并 以 此 为 依据 ， 远 程 定 损 。 

当前 保险 科技 参与 主体 按照 经 营 特 点 分 为 三 类 ， 分 别 是 传统 保险 
公司 、 互 联网 保险 公司 和 技术 服务 公司 。 全 球 已 经 有 超过 1 300 家 保险 
初创 企业 ， 大 多 数 通 过 更 为 精准 的 产品 设计 或 者 全 流程 的 金融 科技 提 
供 服务 。 加 之 阿里 巴巴 、 腾 讯 、 百 度 等 科技 巨头 进军 保险 行业 ， 这 对 
于 传统 保险 公司 无 疑 形成 了 较 大 的 压力 。 普 华 永 道 调 研 显示 ， 保 险 行 
业 对 金融 科技 颠覆 行业 的 担 忱 正在 减弱 。2017 年 大 部 分 受 访 者 

(56%) 预计 其 业务 收入 的 1%~20% 可 能 受到 保险 科技 公司 的 威胁 。 
( 见 图 5.14) 
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图 5.14 未 来 五 年 内 ， 可 能 被 保险 科技 公司 抢 走 的 业务 收入 占 比 
图 片 来 源 ， 普 华 永 道 报告 。 


但 多 数 传统 保险 公司 的 前 途 依 然 堪 忧 。 人 工 智能 对 保险 的 颠 履 会 
来 得 更 加 迅猛 ， 因 为 保险 十 以 场景 为 基础 的 ， 人 工 智 能 的 技术 束 是 以 


场景 为 基础 处 理 特殊 的 任务 。 阿 里 巴巴 、 腾 讯 、 百 度 等 互联 网 公司 通 
过 线 上 服务 比较 精准 地 掌握 了 用 户 的 出 行 、 和 撩 饮 、 娱 乐 、 束 医 、 社 保 


等 场景 数据 ， 通 过 挖掘 数据 来 推销 的 准确 率 要 大 大 高 于 保险 销售 员 的 
地 推销 率 。 并 且 在 人 工 智能 技术 和 信息 服务 平台 上 ， 传 统 的 保险 公司 
也 并 不 占 优 势 。 互 联网 公司 能 联动 互联 网 的 参与 方 (例如 互联 网 电 
商 、 互 联网 社交 、 互 联网 金融 等 公司 及 客户 ) 舱 入 互联 网 背后 的 物 
流 、 文 付 、 消费 者 保障 等 环 三 ， 创 造 刹 的 互联 网 保险 产品 ， 并 实现 从 
保险 产品 的 购买 到 理赔 全 在 线 上 进行 ， 比 如 ， 阿 里 巴巴 根据 用 户 在 其 
电 丙 平台 购买 紧身 牛仔 裤 等 行为 推荐 手机 碎 屏 险 。 


证 券 


计算 机 目 动 化 交易 方兴未艾 ， 更 新 换代 进程 不 断 加 速 ， 曾 经 由 人 
类 主宰 的 金融 领域 ， 也 正 发 生 着 巨大 的 变革 。2000 年 ， 高 盛 在 纽约 总 
部 的 美国 现金 股票 交易 柜台 雇用 了 600 名 交易 员 ， 为 投资 银行 的 大 客户 
买卖 股票 。 但 今天 ， 这 里 只 剩 下 两 名 交易 员 ， 由 200 名 计算 机 工程 师 文 
持 的 自动 交易 程序 已 经 接管 了 其 余 的 工作 。 

融合 机 器 学 习 的 复杂 的 交易 算法 首先 取代 了 市 场 上 很 容易 确定 价 
格 的 交易 ， 包 括 高 盛 以 前 的 600 名 交易 员 操 作 的 股票 。 目 前 一 些 复杂 的 
交易 如 货币 和 信贷 交易 ， 并 不 在 证 券 交 易 所 交易 ， 而 是 通过 不 太 透 明 
的 交易 者 网 络 进行 交易 ， 但 即 是 这 些 复 洒 交易 也 正在 实现 自动 化 。 

跟踪 金融 行业 走向 的 英国 公司 Coalition 表 示 ， 当 前 将 近 45% 的 交易 
都 通过 电子 渠道 完成 。 在 裁员 压力 下 处 理 日 常 运 作 事 务 的 职员 首 当 其 
中 ， 不 光 是 高 威 ， 越 来 越 多 的 银行 加 入 了 裁员 的 浪潮 之 中 。 瑞 银 集团 
的 科技 进步 ， 未 来 数 年 该 行 可 能 裁员 近 3 万 人 ， 占 公司 人 员 的 30%。 

面 对 来 自 人 工 智 能 的 竞争 ， 就 连 许 多 高 薪 人 士 都 将 失业 。 目 前 ， 
高 盛 有 9 000 名 工程 师 ， 占 总 员工 的 3。 接 下 来 ， 将 有 更 多 高 层级 的 工 
作 被 自动 化 ， 高 盛 计 划 让 IPO 〈 首 次 公开 募股 ) 过 程 中 约 146 个 步骤 获 


得 目 动 化 ， 但 传统 工作 上 专注 于 推销 和 建立 人 际 天 系 等 岗位 还 暂时 不 
会 被 取代 。 


图 5.15 八 年 前 瑞 银 集团 的 交易 大 厅 


图 片 来 源 : https://www.zerohedge.com/news/2016-12-20/worlds-largest-trading-floor-sale 。 
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图 5.16 如 今 瑞 银 集团 的 交易 大 厅 


图 片 来 源 : https://www.zerohedge.com/news/2016-12-20/worlds-largest-trading-floor-sale 。 


入 能 投资 顾问 最 早 在 2008 年 左右 兴起 于 美国 ， 义 称 机 器 人 投资 顾 


问 (Robo-Advisor) 。 依 据 现代 资产 组 合理 论 ， 结 合 个 人 投资 者 的 风 
险 偏好 和 理财 目标 ， 利 用 算法 和 友好 的 互联 网 界面 ， 为 客户 提供 财富 
管理 和 在 线 投资 建议 服务 。 


根据 美国 金融 监管 局 (FINRA) 2016 年 3 月 提出 的 标准 ， 理 想 的 智 
A 大 类 资产 配置 、 投 资 组 合 选 择 、 交 易 执 

` 组 合 再 平衡 、 税 负 管 理 和 组 合 分 析 。 传 统 投 顾 和 智能 投 顾 都 是 基 
ee 只 是 实施 的 方式 不 同 ， 而 智能 投 顾 本 质 上 是 技术 代 
替 人 工 实现 投 顾 。 但 相对 于 公司 职员 ， 智 能 顾问 的 优势 是 ， 它 可 以 不 
知 疲倦 地 监控 投资 组 合 的 表现 ，24 小 时 不 停 欣 地 工作 ， 还 可 以 对 所 有 
的 投资 组 合同 等 对 待 。 最 重要 的 是 它 大 幅 降 低 了 成 本 ， 因 为 机 器 人 服 
务 的 使 用 ， 美 国 以 前 以 50 万 ~100 万 美元 为 起 点 的 理财 产品 今天 降低 到 5 
万 美元 ， 费 用 从 5% 降 到 0.3%~0.59%。 


据 权 威 在 线 统计 数据 门户 Statista 数 据 显 示 ，2017 年 全 球 智能 投 顾 
管理 资产 超过 2 248 亿 美元 ， 年 增长 率 高 达 47.5%， 到 2021 年 全 球 智能 
投 顾 管理 资产 规模 将 超过 1 万 亿美 元 。 ( 见 图 5.17) 


2015 年 3 月 ， 嘉 信 理 财 (Charles Schwab) 推出 了 免 咨 询 费 的 智能 
投 顾 平 台 的 Intelligent Portfolios。 该 投 顾 平 台 能 够 覆盖 高 达 20 种 不 同 的 
资产 ， 根 据 不 同 投资 者 的 需求 、 风 险 偏 好 、 收 入 水 平 ， 通 过 后 台 运 算 
来 制定 投资 组 合 。 受 托管 理 规模 的 快速 上 涨 说 明 其 智能 投 顾 体 系 在 一 
定 程度 上 能 够 吸引 客户 ， 给 公司 带 来 增 量 收入 ， 优 化 收入 结构 。 截 至 
2017 年 第 二 季度 ， 公 司 智能 投 顾 平台 总 共 受 托管 理 客户 资产 194 亿 美 
元 ， 较 上 年 同期 上 涨 137%， 较 第 一 季度 环比 上 涨 22%。 这 个 智能 投 顾 
平台 的 鳃 利 模式 主要 是 来 自 嘉 信人 交易 型 指数 基金 ETF 产 品 的 管理 费 、 
为 第 三 方 发 行 的 被 选 入 智能 投 顾 组 合 的 ETF 产 品 的 服务 费 、ETF 申 购 赎 
回 等 交易 费用 ， 以 及 一 些 类 似 货 币 基金 产品 的 收益 。 束 支出 成 本 而 
言 ， 其 平均 受托 管理 资产 的 文 出 成 本 远 低 于 其 他 大 型 经 纪 商 和 投资 银 
行 。 
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图 5.17 智 能 投 顾 管理 资产 总 额 


数据 来 源 : Statista 。 

日 盛 证 券 在 2017 年 11 月 推出 AI 理财 机 器 人 一 -AI 理财 狮 ， 可 以 为 
投资 人 提供 线 上 24 小 时 即 问 即 答 服务 ， 上 线 2 个 月 丈 吸 引 超 过 万 名 投资 
人 尝试 ， 发 问 次 数 4 万 多 次 ， 使 用 程度 相当 活路 。 

对 证 券 公司 、 投 资 银行 来 说 ， 裁 员 意 味 着 更 丰厚 的 利润 。 根 据 联 
盟 研 究 统计 ， 在 销售 、 交 易 和 人 研究 领域 ， 全 球 12 个 最 大 的 投资 银行 员 
工 的 平均 薪酬 为 50 万 美元 ， 包 括 薪 资 和 奖金 。 而 联盟 研究 主管 Amrit 
Shahani 《安稳 立 特 : 沙 哈尼 ) 说 ， 华 尔 街 75% 的 薪酬 给 了 那些 高 薪 
的 “前 端 * 员 工 。 一 旦 这 些 交 易 员 被 机 器 取代 ， 他 们 以 前 获得 的 薪酬 就 
将 直接 计 入 公司 利润 。 这 同时 也 引发 了 人 们 对 失业 的 担忧 ， 因 为 曾经 
光鲜 亮丽 的 部 分 华尔街 精英 也 难 逃 这 次 冲击 。 


智能 时 代 万 物 寡 媒 ， 人 机 协作 时 代 已 经 来 临 


人 工 智 能 正在 彻底 重 塑 媒体 产业 ， 线 索 、 策 划 、 采 访 、 生 产 、 分 
发 、 反 馈 等 全 新闻 链 路 都 因为 人 工 智 能 的 到 来 而 发 生变 单 ， 媒 体 也 正 
在 走 癌 智 媒 时 代 。 人 工 智能 不 仅 能 够 帮助 媒体 从 业者 更 快 地 发 现 线 
索 ， 辅 助 或 目 主 生产 新 闻 ， 并 能 根据 每 个 受众 的 喜好 有 和 针对 性 地 分 发 
新 闻 ， 同 时 它 能 为 商家 匹配 更 精准 的 广告 ， 让 媒体 更 好 地 实现 商业 
人 人才 


目 动 化 写作 


目前 的 目 动 化 写作 已 经 得 到 较 广泛 的 应 用 ， 最 初 多 以 财经 和 体育 
新 闻 的 快讯 、 短 讯 及 财报 为 主 ， 因 为 这 些 报道 一 般 能 够 较 好 地 拿 到 结 
构 化 的 数据 。 随 大 技 术 的 发 展 ， 目 动 化 写作 机 器 人 的 能 力 开 始 履 雷达 


题 、 写 稿 、 校 对 等 全 方位 的 功能 ， 题 材 也 拓展 到 灾难 、 犯 罪 、 选 举 等 
领域 。 而 且 时 间 更 快 ， 还 可 以 定制 。 ( 见 表 5.3) 
表 5.3 新 闻 机 器 人 发 展 大 事 记 


公 避 做 法 


美国 汤姆 森 公 司 用 机 器 人 记者 撰写 经 济 和 金融 
方面 的 新 闻 

路 透 社 路 透 社 的 Open Calais 在 校对 界 大 显 身手 
Narrative Science 公司 机 器 人 用 算法 把 数据 转化 
成 财经 和 房地产 报道 

《华盛顿 邮 报 》 《华盛顿 邮 报 》 新 闻 核 查 机 器 人 Truth Teller 

AI 公 司 的 机 器 人 Wordsmith 针对 读者 生产 定制 


版 内 容 
《洛杉矶 时 报 》 机 吉 人 Quakebot 在 地 震 发 生 3 


分 钟 后 自动 生成 和 发 布 了 报道 。 除 了 灾难 新 闻 ， 
《洛杉矶 时 报 》 还 开发 出 快速 发 布 犯罪 新 闻 的 机 
器 人 

《 卫 报 》 机 各 人 生产 出 靠 算 法 编辑 的 纸 质 报纸 

美 联 社 全 面 利 用 机 器 人 Wordsmith 写作 ， 仅 需 
美 联 社 0.3 秒 就 可 以 撰写 、 发 布 上 市 公司 盘 利 报道 ， 还 
能 定制 多 种 语言 风格 

法 国 《 世 界 报 》 和 Syllabs 公司 合作 ， 用 机 器 人 
记者 报道 了 选举 活动 

《纽约 时 报 》 的 机 器 人 编辑 Blossom 每 天 会 从 
2015 年 8 月 | 《纽约 时 报 》 | 300 多 篇 文章 中 挑 出 “潜力 股 "， 推 荐 给 编辑 。 
其 平均 点 击 量 是 普通 文章 的 38 倍 


汤姆 森 


Narrative Sclence 


Wordsmith 


《洛杉矶 时 报 》 


2015 年 法 国 《 志 界 报 》 


腾讯 财经 推出 了 国内 第 一 篇 由 Dreamwriter 撰写 
2015 年 9 月 | 《腾讯 财经 》 加 
的 “机 器 人 新 闻 ” 
| 新 华 社 推出 “ 快 笔 小 新 ”， 从 事 体 育 和 经 济 信 息 
2015 年 11 月 新 华 社 
报道 


公 局 做 法 


阿里 巴巴 


快 、 好 
今日 头条 推出 Xiaomingbot ( 张 小 明 ), 实时 撰写 


今日 头条 


里 约 奥运 会 新 闻 稿 件 

《华盛顿 邮 报 》 采 用 写 稿 软件 Heliograf 报道 里 约 
《华盛顿 邮 报 》| 奥运 会 ， 几 秒 即 可 生成 并 发 布 一 条 Twitter ( 推 
特 ) 新 闻 


数据 来 源 : 中 国人 民 大 学 新 闻 坊 。 


美 联 社 是 自动 化 新 闻 最 早 的 探索 者 之 一 。2013 年 夏天 ， 美 联 社 的 
新 闻 部 门 负责 人 提出 一 个 在 当时 看 来 略 显 激进 的 想法 一 -引入 人 工 智 
能 进行 自动 化 新 闻 创 作 。 几 个 月 后 ， 在 Automated Insights (研究 新 闻 
自动 生成 的 技术 公司 ， 位 于 美国 北 卡 罗 来 纳 州 ) 的 技术 支持 下 ， 美 联 
社 获得 了 通过 机 器 自动 生产 新 闻 的 能 力 ， 从 体育 新 闻 简 报 起 步 ， 在 
2014 年 开始 使 用 算法 自动 生成 财报 报道 。 美 联 社 当 时 估计 这 个 做 法 能 
释放 记者 20% 的 时 间 ， 可 以 让 这 些 记者 从 事 更 为 复杂 和 关键 的 工作 。 
2015 年 ， 美 联 社 制定 了 一 个 五 年 (2015 一 2020 年 ) 战略 规划 。 美 联 社 
战略 及 企业 发 展 部 高 级 副 总 裁 Jim Kennedy (吉姆 :肯尼迪 ) 希望 在 2020 
年 之 前 ， 美 联 社 80% 的 新 闻 内 容 生 产 都 能 实现 自动 化 。 美 联 社 全 球 商 
业 编 辑 Lisa Gibbs ( 丽 莎 : 吉 布 斯 ， 说: “通过 上 自动 化 ， 美 联 社 向 客户 提 
供 的 公司 财报 发 布 报道 是 以 前 的 12 倍 ， 其 中 包括 许多 从 未 受到 什么 关 
注 的 非常 小 的 公司 。 利 用 这 些 释放 出 来 的 时 间 ， 美 联 社 记者 可 以 参与 


更 多 用 户 生 成 的 内 容 ， 制 作 多 媒体 报道 ， 追 踩 调查 报道 ， 并 专注 于 更 
复杂 的 新 闻 。” 


腾讯 是 中 国 目 动 化 新 闻 最 早 的 演 试 者 。 中 国 的 目 动 化 新 闻 为 什么 
比 海外 上 晚 了 将 近 十 年 ? 除了 我 国 媒体 上 自身 意愿 和 人 员 成 本 比 西 方 国家 
低 以 外 ， 西 方 媒体 更 侧重 于 和 技术 公司 合作 ， 例 如 德国 的 AX 
Semantics 、 美 的 Narrative Science 、 法 的 SYLLABS 和 
LABSENCE、 英 国 的 Arria 等 为 媒体 提供 了 解决 方案 或 技术 文 撑 ， 而 中 
国 的 媒体 大 多 上 自行 研究 机 右 写 作 技 术 。2015 年 9 月 ， 腾 讯 财 经 开发 的 机 
器 人 Dreamwriter 发 布 了 一 篇 关于 8 月 CPI (居民 消费 价格 指数 ) 的 稿件 
一 一 《8 月 CPI 同 比 上 涨 2.0% 创 12 个 月 新 高 》。 如 图 5.18 所 示 ， 稿 件 分 
为 两 部 分 ， 第 一 部 分 是 数据 本 身 ， 第 二 部 分 是 各 界 人 士 对 数据 的 分 析 
解读 。 之 后 ，Dreamwriter 持 续 发 布 新 闻 稿 件 ， 根 据 《 中 国 新 媒体 趋势 
报告 2016》 数 据 显 示 ，2016 年 第 三 季度 ， 腾 讯 财经 机 絮 人 写作 文章 的 
数量 达到 了 4 万 篇 。 

Dreamwriter 写 作 的 整个 流程 主要 包括 数据 库 的 建立 、 机 妖 对 数据 
库 的 学 习 、 束 具体 项 目 进 行 写作 、 内 容 审核 、 分 发 5 个 环 记 。 腾 讯 要 先 
通过 购买 或 自己 创建 数据 库 ， 然 后 让 Dreamwriter 对 数据 库 内 的 各 项 数 
据 进行 学 习 ， 生 成 相对 应 的 写作 手法 ， 全 部 学 习 完 之 后 便 可 以 进行 与 
数据 库 相 关联 的 狐 闻 事件 的 报道 写作 ， 写 作 完 成 后 进入 审核 环节 ， 最 
后 通过 腾讯 的 内 容 发 布 平台 到 达 用 户 端 。 (如 图 5.19) 


8 月 CPI 同比 上 涨 2.0% 创 12 个 月 新 高 


腾讯 财经 讯 国家 统计 局 周 四 公布 数据 显示 ，8 月 CPI 同比 上 涨 2.0%， 涨幅 比 7 
月 的 1.6% 略 有 扩大 ， 但 高 于 预期 值 1.9%9， 并 创 12 个 月 新 高 。 


国家 统计 局 城市 司 高 级 统计 师 余 秋 梅 认为 ， 从 环比 看 ，8 月 份 猪 肉 、 鲜 菜 和 和 蛋 
等 视频 价格 大 幅 上 涨 ， 是 CPI 环比 涨幅 较 高 的 主要 原因 。8 月 份 猪肉 价格 连续 第 四 
个 月 恢复 性 上 涨 ， 环比 涨幅 为 7.79%6， 影 响 CPI 上 涨 0.25 个 百分点 。 部 分 地 区 高 温 、 
暴雨 天 气 交 蔡 ， 影 响 了 鲜 菜 的 生产 和 运输 ， 鲜 某 价格 环比 上 涨 6.8%， 影 响 CPI 上 涨 
0.21 个 百分点 。 蛋 价 环 比 上 涨 10.2% ， 影 响 CPI 上 涨 0.08 个 百分点 ,但 8 月 价格 仍 
低 于 去 年 同期 。 猪 肉 、 鲜 莱 和 和 蛋 三 项 合计 影响 CPI 环比 上 涨 0.54 个 百分点 。 超 过 8 
月 CPI 环比 总 涨幅 。 


他 表示 ， 从 同比 看 ，8 月 份 CPI 同比 上 涨 2.0% ,涨幅 比 上 月 扩大 0.4 个 百分点 ， 
主要 原因 是 视频 价格 同比 涨幅 有 所 扩大 。8 月 份 ， 食 品 价格 同比 上 涨 3.7%， 涨幅 比 
上 月 扩大 1.0 个 百分点 ， 其 中 猪肉 、 鲜 菜 价 格 同比 分 别 上 涨 19.6% 和 15.99%%， 合 计 影 
响 CPI 上涨 1.05 个 百分点 。 非 食品 价格 同比 上 涨 1.1%， 涨 幅 与 上 月 相同 ,但 家 庭 服 
务 、 烟 草 、 学 前 教育 、 公 共 汽 车 票 和 理发 等 价格 涨幅 仍然 较 高 ， 涨 幅 分 别 为 7.4%、 
6.8% 、5.6% 、5.3%5 和 5.2%。 


图 5.18 腾 讯 写 作 机 器 人 生成 的 财经 报道 


图 片 来 源 ， 腾讯 新 闻 。 


图 5.19 机 器 写作 的 流程 


图 片 来 源 : 中 国人 民 大 学 新 闻 坊 。 

自动 化 写作 无 论 是 对 新 闻 行业 还 是 对 读者 来 说 ， 都 带 来 了 显 而 易 
见 的 好 处 。 对 新 闻 工 作者 来 说 ， 他 们 可 以 把 程式 化 、 重 复 化 的 劳动 交 
给 机 器 ， 自 己 进行 更 深度 的 思考 与 写作 ， 并 且 在 写作 过 程 中 能 够 得 到 
人 工 智能 的 支撑 ， 写 作 后 有 系统 校对 。 对 读者 来 说 ， 这 些 新 闻 最 重要 
的 需求 是 快 ， 对 于 体育 、 财 经 、 地 震 等 对 时 效 性 要 求 极 高 的 报道 显得 
更 为 明显 。 另 外 ， 满 足 用 户 对 长 尾 内 容 与 个 性 化 内 容 的 需求 ， 在 传统 
新 闻 理论 中 ， 某 些 冷 门 比赛 的 报道 价值 不 大 ， 但 实际 上 依然 有 可 观 的 
阅读 量 ， 比 如 棒球 比赛 对 于 中 国 棒球 球迷 ， 乒 乓 球 比赛 对 于 美国 乒乓 
球 球迷 。 


随 着 目 动 化 新 闻 数 量 的 增多 和 深度 的 加 强 ， 其 育 后 算法 的 设 定 束 
开始 受到 怀疑 。 虽 然 大 多 数目 动 化 新 闻 设 是 了 审核 环 条 ， 但 是 在 实际 
操作 过 程 中 ， 为 了 时 效 性 ， 大 多 数 并 没有 经 过 人 工 审核 。 这 样 可 能 
现 的 后 果 和 是 ， 一 个 错误 的 稿件 可 以 瞬间 发 给 百 万 级 的 用 户 。 谷 歌 技 术 
孵化 器 Jigsaw 的 沟通 负责 人 入. 肯 瑟 琳 称 : “算法 容易 产生 偏见 ， 就 像 人 
类 一 样 。 我 们 需要 以 在 新 闻 报 道中 处 理事 实 的 这 慎 来 对 行 数字。 它们 
需要 被 检查 ， 它 们 需要 被 确认 ， 它 们 的 背景 需要 被 理解 。” 这 束 要 求 新 
闻 工 作者 不 仅 要 参与 部 分 内 容 的 审核 ， 还 要 和 算法 工程 师 一 道 ， 让 机 
右 拥 有 更 准确 的 表述 能 力 和 价值 观 。 


辅助 写作 


智 媒 时 代 不 是 人 工 智能 对 新 闻 工 作者 的 蔡 代 。 相 反 ， 人 工 智能 结 
合 互 联网 更 好 地 连接 了 人 与 人 ， 更 好 地 汇聚 人 的 智慧 ， 并 拓展 了 人 的 
能 力 。 在 未 来 的 新 闻 行 业 里 ， 记 者 和 人 工 稚 能 形成 < 人 机 联姻 ?的 生产 
模式 。 算 法 分 析 数 据 、 发 现 有 趣 的 故事 线索 ， 记 者 进行 复 洒 变量 的 处 
理 和 判断 ， 微 妙 情感 天 系 的 处 理 和 表达 ， 采 访 重 要 人 物 以 及 幕后 故事 
的 发 气 等 ， 在 人 执行 的 每 一 步 工作 流程 中 人 工 入 能 都 将 有 一 定 的 参 
Ee 


1. 语 音 识别 技术 在 新 闻 工 作 中 广泛 使 用 


语 首 识 别 技 术 能 使 记者 减少 每 天 必须 完成 的 日 党 任务。 传统 的 新 
闻 末 访 后 的 隶 首 整理 是 一 项 特别 耗 时 耗 力 的 工作 ， 据 雷诺 兹 狐 闻 人 研究 
所 (RJI) 最 近 对 美国 超过 100 名 记者 进行 的 调查 显示 ， 记 者 每 周平 均 
化 费 3 个 小 时 访问 采访 对 象 ， 并 伦 一 倍 的 时 间 把 采访 的 隶 首 整理 出 来 。 
然而 通过 语音 识别 技术 ， 可 以 轻松 完成 这 项 工作 ， 国 内 新 闻 工 作者 开 
始 借助 讯 飞 语 记 等 应 用 减少 工作 负担 。RJI 未 来 实验 室 开发 的 一 个 市 语 
首 转 文字 功能 的 App“Recordly” 也 希望 能 够 做 到 这 一 点 。 该 项 目 负 贡 人 人 


玉带 亚 :- 拉 杜 (Sintia Radu) 表示 : “Recordly 出 自我 们 自己 希望 报道 和 
写作 过 程 更 加 有 效 的 需求 。 我 们 把 听 录 首 看 成 浪费 上 时间， 我 们 认为 ， 
以 这 个 烦人 的 工作 开始 写 任何 报道 都 是 适得其反 ， 当 作者 听 完 孙 音 以 
后 ， 再 要 把 报道 完成 时 已 经 很 疲惫 了 。” 


2. 深 度 学 习 能 够 增强 记者 的 分 析 能 力 


深度 学 习 能 够 更 深入 分 析出 受 访 者 或 事件 育 后 的 深层 次 关系 。 在 
2017 年 1 月 的 总 统 惑 职 演讲 过 程 中 ， 美 联 社 与 IBM 的 沃 和 森 认 知 技术 平台 
合作 ， 利 用 人 工 帝 能 对 特 表 普 的 面部 表情 进行 分 析 ， 同 时 结合 符 朗 普 
的 演讲 文本 、 演 讲 语调 、 人 格 洞 悉 和 社交 媒体 趋势 等 数据 形成 一 些 基 
于 情感 分 析 赋 值 的 微 表 达 新 闻 报 道 。 淆 森 机 器 人 对 特 朗 普天 键 情 绪 触 
发 点 进行 了 打分 ， 给 出 的 情感 分 析 结 果 是 “悲伤 ”〈0.4996) 大 于 “ 喜 
悦 ”(0.4555) ， 且 情绪 表达 更 为 “偏激 ”， 这 一 点 与 后 来 《今日 美国 》 
发 布 的 新 闻 “ 分 析 : 特 朗 普 短 小 、 墨 暗 且 有 挑 妊 意味 的 丈 职 演说 ?在 情 
感 色彩 表达 上 不 谋 而 合 。 ( 见 表 5.4) 

表 5.4 IBM 沃 森 给 特 朗 普 就 职 演讲 各 类 情绪 所 打 的 分 数 


0.754812 


分 数 


0.075456 


0.231049 


0.068197 


0.455526 


0.499659 


资料 来 源 : IBM Waston 。 

目前 ， 还 有 一 类 “商业 关系 图 谱 ” 公 司 ， 利 用 深度 学 习 和 大 数据 技 
术 ， 发 掘 商业 人 物 、 人 公司、 财产 等 之 间 的 关联 。 例 如 国内 的 “天 服 
查 ” 软 件 通过 分 析 国 内 8 000 万 家 人 企业、 人、 实体 之 间 关 系 的 投资 结 
构 ， 个 体 商 户 工商 信息 以 及 企业 商标 信息 库 ， 公 开 的 诉讼 信息 等 海量 
数据 库 ， 用 深度 学 习 、 大 数据 技术 解析 出 商业 社会 关系 网 络 ， 让 人 物 
关系、 公司 持 股 等 关系 一 目 了 然 ， 目 前 已 经 被 记者 用 于 新 闻 报 道中 。 


3. 机 响 视 觉 技术 有 助 于 查找 信息 和 数据 


机 器 视觉 技术 主要 用 于 从 照片 和 视频 中 目 动 提取 描述 数据 ， 例 如 
位 置 ， 可 识别 的 人 、 地 点 和 事物 等 有 价值 的 元 数据 ， 使 图 像 更 容易 管 
理 或 被 搜索 、 发 现 ， 既 便于 编辑 快速 分 类 和 组 织 大 量 图 像 和 视频 的 语 
料 库 ， 提 高 编辑 速度 ， 又 为 调查 记者 提供 了 丰富 的 调查 证 据 。 

美 联 社 使 用 Digital Globe (美国 高 分 辩 率 地 球 影像 服务 供应 商 ) 的 
卫星 图 像 搁 术 ， 来 锁定 东南 亚 海域 轮船 的 高 分 辨 紊 图像 ， 以 便 获 得 一 


个 天 于 海洋 捕捞 行业 小 捕 的 调查 项 目的 重要 证 据 ， 该 报道 在 2016 年 获 
得 普 利 策 奖 中 的 公共 服务 奖 。Digital Globe 的 计算 机 视觉 算法 能 够 调整 
其 卫星 摄像 涉 ， 招 摄 最 佳 和 必要 的 图 像 ， 这 些 图 像 给 予 靳 闻 工 作者 一 
个 “上 帝 视 角 ”， 为 新 闻 报告 提供 了 一 个 全 新 的 参考 点 ， 这 超出 了 传统 
新 闻 报 道 团队 的 能 力 范围 。 ( 见 图 5.20) 


在 男 一 个 工作 场景 中 ， 文 本 转 视频 平台 Wibbitz 利 用 图 像 识 别 ， 目 
动用 编辑 图 片 和 视频 脚本 生成 匹配 一 段 给 定 文本 的 视频 ， 生 成 粗 药 的 
视频 供 编辑 人 员 进 一 步 精 编 。 这 样 允 许 记者 更 多 地 关注 内 容 ， 更 少 地 
关注 制 作 视频 的 重复 工作 。 平 台 使 更 多 人 能 够 更 快 、 更 好 和 更 有 效 地 
工作 ， 也 能 帮助 制 片 人 大 规模 创作 有 吸引 力 的 视频 。2016 年 ， 阿 里 云 
还 演示 了 一 段 人 工 智能 解说 NBA (美国 职业 篮球 联赛 的 视频 ， 这 项 
技术 在 电视 、 网 络 媒体 的 即时 播报 中 也 将 发 挥 重 要 作用 。 


约 83.4x13.3 米 类 似 的 攀 杆 
ye 


相连 接 


约 31.6 x8.7 米 


约 43.7x9.0 米 


图 5.20 东 南亚 商船 运送 货物 路 线 的 卫星 图 像 《7 月 14 日 银 海 2 号 在 阿拉 弗 拉 海 ) 


图 片 来 源 : Digital Globe 。 


传 感 万 新 邮 


2013 年 ， 纽 约 公 共 广 播 的 数据 新 闻 团 队 借助 土壤 温度 传 感 磺 ， 准 
确 报 道 了 美国 东海 岸 蝉 的 回迁 。 这 应 该 是 传 感 融 新 闻 的 最 初探 索 之 
一 。 随 着 智能 终端 呈现 指数 级 增长 《美国 计算 机 技术 工业 协会 预测 到 
2020 年 将 达到 500 亿 人 台 ) ， 未 来 社会 越 来 越 多 的 信息 将 直接 通过 这 些 终 
端的 传感器 获取 ， 呈 现 万 物 丝 媒 的 趋势 。 

传 感 郁 必 将 改变 新 闻 的 采集 手段 。 在 这 个 层面 上 的 传感器 ， 是 人 
的 感官 延伸 ， 可 以 在 一 定 程度 上 帮助 人 突破 目 身 的 局 限 ， 从 更 多 空 
间 、 更 多 维度 获得 与 解读 信息 。 通 过 传 感 硕 获得 的 大 规模 环境 信息 、 
地 理 信息 、 人 流 信 息 、 物 流 信息 、 目 然 界 信息 等 ， 可 以 为 专业 媒体 的 
报道 提供 更 为 丰富 、 可 靠 的 数据 ， 甚 至 可 以 为 计 题 的 发 现 提供 线索 。 
传感器 对 某 些 特定 对 象 或 环境 的 监测 能 力 ， 也 使 它们 可 以 更 灵敏 地 感 
知 未 来 动 品 ， 为 预测 性 报道 提供 依据 。 净 化 器 公 司 了 解 每 个 家 性 的 空 
气 状 况 ， 智 能 手表 、 智 能 手 环 公司 能 够 获取 一 个 地 区 民众 的 运动 和 刁 
体 状 况 。 示 来， 媒体 可 能 需要 寻求 掌握 该 类 数据 的 合作 伙伴 ， 从 更 
深 、 更 广 的 层面 获取 新 闻 信 息 ， 从 而 市 来 新 的 可 能 性 。 


美国 堪萨斯 城 一 家 创业 公司 ShotTracker 就 开发 了 一 套 智 能 系统 。 
这 套 系 统 通 过 在 球鞋 和 篮球 中 植 入 传感器 ， 回 人 们 传达 球场 上 的 一 切 
言 轧 ， 从 而 让 篮球 比赛 变 得 更 加 透明 。ShotTracker 系 统 还 能 根据 球员 
和 球 在 场 上 的 移动 数据 进行 实时 分 析 ， 包 括 球员 投篮 次 数 、 失 误 次 
数 、 助 攻 、 抢 断 、 扣 篮 等 动作 ， 对 球员 情况 进行 一 系列 分 机， 把 在 本 
次 比赛 中 球员 的 优势 和 劣势 都 以 数据 的 形式 呈现 出 来 。 该 类 传感器 的 
普及 ， 将 使 体育 新 闻 报 道中 球员 表现 等 数据 的 准确 性 大 幅 提 升 。 ( 见 
图 5.21) 


图 5.21 NBA 借 传感器 绘制 比赛 中 篮球 与 球员 的 运动 轨迹 


图 片 来 源 : cnbeta 。 


另外， 传感器 还 有 “用 户 反 馈 ” 的 价值 。 作 为 反馈 机 制 的 传感器 
将 用 户 反 馈 深 化 到 了 生理 层面 。 传 感 絮 可 以 采集 用 户 的 心跳 、 脑 电波 
Ei 眼 动 轨迹 等 身体 数据 ， 准 确 测 量 用 户 对 于 某 些 信息 的 反应 状 

这 样 一 个 层面 的 反馈 ， 不 仅 可 以 更 真实 、 精 确 地 反映 信息 在 每 个 
J 出 的 传播 效果 ， 也 可 以 为 信息 生产 的 实时 调节、 个 性 化 定制 或 长 
远 规 划 提 供 可 靠 的 依据 。 


在 智能 物体 作为 信息 采集 者 日 益 普 及 时 ,“ 物 一 人 ”之 间 的 直接 信 
息 交 互 也 将 逐渐 变 成 常态 。 由 “ 物 ” 所 监测 或 感知 的 某 些 信息 ， 也 许 通 
过 “ 物 一 人 ”信息 系统 ， 束 能 直接 到 达 目 标 受众 ， 这 会 使 专业 媒体 的 中 
介 性 意义 被 削弱 甚至 可 能 出 现 OGC (Object Generated Content， 物 体 
生产 内 容 ) 。 


个 性 化 新 邮 


个 性 化 新 闻 在 今天 已 被 普通 接受 ， 它 主要 体现 在 三 个 层面 : 一 十 
个 性 化 推送 ， 二 是 对 话 式 呈 现 ; 三 是 定制 化 生产 ， 这 是 个 性 化 新 闻 的 
更 高 目标 ， 它 的 成 熟 与 普及 取决 于 更 深层 的 用 户 洞察 能 力 。 


1. 个 性 化 推送 


个 性 化 推送 凸显 了 算法 对 于 新 闻 分 发 的 意义 ， 算 法 的 水 平 决定 了 
个 性 化 匹配 的 精准 程度 。 一 个 人 长 期 使 用 某 App 浏 览 新 闻 ， 该 用 户 的 
阅读 数据 不 会 被 不 断 地 反馈 进 数 据 库 ， 用 户 画 像 束 逐渐 清晰 。 同 时 ， 
随 着 用 户 数量 的 增加 ， 通 过 相似 点 描绘 可 以 将 人 不 断 地 分 群 ， 从 而 进 
行 群体 分 发 ， 再 加 上 之 前 素 积 的 数据 ， 通 过 算法 运算 完成 智能 化 的 推 
厦 。 但 令 大 家 担忧 的 是 ， 算 法 容易 锌 其 所 有 公司 或 更 高 的 利生 集团 所 
控制 ， 失 去 新 闻 报道 的 独立 性 和 对 社会 进步 的 推动 作用 ， 这 一 点 已 经 
在 宁国 的 个 性 化 新 闻 中 有 所 体现 "章法 只 提 估 受众 喜欢 阅读 或 认同 的 
信息 内 容 ， 导 致 个 人 消费 越 来 越 多 的 同类 信息 ， 以 致 个 体 受 从 不 太 可 
能 阅读 到 与 其 意见 相左 的 信息 或 观点 ， 社 会 上 不 同 声音 之 间 的 沟通 交 
流 日 趋 减 少 ， 社 会 言论 也 越 来 越 单 一 。 算 法 让 “过 滤 气 泡 ? 现 象 更 加 产 
重 ， 给 社会 与 论 的 健康 沉 来 风险 。 


2. 对 话 式 呈现 


一 些 媒体 正在 探索 社交 机 器 人 在 新 闻 传 播 中 的 应 用 ， 它 们 将 某 些 
新 闻 的 获取 和 阅读 过 程 变 成 一 个 互动 对 话 过 程 ， 通 过 机 器 人 与 用 户 的 
对 话 ， 来 了 解 用 户 的 阅读 偏好 ， 进 而 推荐 相关 的 内 容 ， 但 用 户 是 否 愿 
意 承 受 这 种 对 话 的 成 本 ， 仍 需 观 察 。 例 如 ， 全 球 数 干 万 的 用 户 可 以 要 
求 亚马逊 或 谷歌 的 智能 音箱 播放 美国 在 线 、《 华 盛 顿 邮 报 》 3 小 时 内 
的 精彩 新 闻 。 


3. 定 制 化 生产 


和 今天 纯粹 用 算法 做 匹配 的 机 制 不 完全 一 样 ， 未 来 还 会 生成 所 谓 
定制 化 信息 的 生产 ， 即 基于 大 数据 分 析 的 、 基 于 场景 的 个 人 化 信息 定 
制 ， 针 对 用 户 的 兴趣 生产 和 讲解 。 定 制 化 生产 是 个 性 化 新 闻 的 更 高 目 
标 ， 它 的 成 熟 与 普及 取决 于 更 深层 的 用 户 洞察 能 力 ， 场 景 分 析 是 理解 
用 户 在 特定 环境 下 需求 的 一 把 钥匙 。Automated Insights 已 经 在 该 方面 
进行 尝试 ， 雅 虎 正在 合作 关于 幻想 运动 (fantasy sport) 的 内 容 ， 用 户 
可 以 选择 真实 比赛 中 登场 的 运动 员 ， 组 成 自己 的 球 队 ， 和 朋友 之 间 相 
互 比赛 ， 在 美国 每 周 有 超 过 3 000 万 用 户 使 用 这 项 内 容 ， 为 每 一 对 匹配 
的 对 抗 组 进行 报道 ， 用 户 能 够 知道 关注 的 队伍 表现 得 怎样 ， 投 球 表现 
如 何 ， 胜 利 了 还 是 失败 了 。 雅 虎 曾 经 的 做 法 是 发 布 一 个 报道 ， 让 千 百 
万 人 同时 读 它 ，Automated Insights 能 够 发 布 千 万 个 报道 ， 而 且 每 个 报 
道 都 是 独一无二 、 专 门 为 用 户 定制 的 。 


和 祝 营 城市 - “上 帝 视 角 ” 的 城市 管理 


早 在 2008 年 IBM 就 提出 了 智慧 城市 的 概念 ， 从 交通 、 医 疗 、 能 
源 、 政 府 、 水 资源 、 安 全 、 楼 宇和 园区 领域 为 政府 提供 整套 的 智慧 城 
市 方案 。 目 的 是 让 城市 运转 更 加 高 效 环保 ， 管 理 更 加 科学 ， 并 能 提前 
发 现 问题 ， 如 交通 拥堵 、 环 境 污染 、 公 共 安 全 等 。 随 后 ， 多 个 国家 开 
始 了 智慧 城市 的 实践 ， 高 峰 时 期 IBM 曾 有 超过 1 000 个 智慧 城市 项 目 在 
建 。 但 普通 市 民 似 乎 并 未 感受 到 拥堵 的 交通 状况 有 所 改善 ， 地 震 、 火 
灾后 政府 的 响应 能 力 有 所 加 快 ， 就 医 的 体验 有 所 提升 。 

企业 、 政 府 、 未 来 学 家 都 希望 将 城市 打造 成 一 个 高 度 统一 的 智能 
系统 ， 但 庞大 的 软件 、 硬 件 、 基 础 设施 投入 和 短期 内 有 限 的 效益 形成 
了 较 大 反差 。 不 少 政府 放弃 了 IBM 起 初 的 方案 ， 转 而 从 垂直 领域 出 
发 ， 从 解决 具体 问题 入 手 ， 提 高 城市 的 智能 化 水 平 。 而 AI 在 其 中 扮演 


了 越 来 越 重要 的 角色 ，AI 推 动 下 的 安防 、 区 通 系 统 、 政 务 服务 、 环 境 
保护 等 都 获得 了 质 的 突破 。 


智能 交通 


交通 问题 是 让 很 多 大 城市 政府 头疼 的 问题 ， 即 使 有 明确 的 交通 规 
则 和 更 寅 的 马路 ， 堵 车 也 会 发 生 。 因 为 交通 系统 是 典型 的 * 非 线性 系 
统 ”"， 有 非常 多 的 因素 相互 牵制 和 互相 依赖 。 在 大 城市 上 班 的 市 民 一 定 
会 感受 到 ， 早 高 峰 的 时 候 ， 你 6:00 出 门 ， 就 能 早 半 小 时 到 达 ， 而 你 再 
晚 10 分 钟 出 门 ， 可 能 就 会 迟到 。 

2016 年 ， 麻 省 理工 学 院 、 瑞 士 苏黎世 理工 学 院 和 意大利 国家 研究 
委员 会 联合 研究 团队 已 经 研发 出 一 款 新 道路 系统 ， 在 道路 上 将 不 再 有 
交通 信号 灯 ， 并 提出 了 “基于 时 段 的 交叉 路 口 ”概念 ， 其 与 航空 交通 管 
制 系统 相似 ， 即 每 辆 汽车 接近 交叉 路 口 时 ， 由 交通 管理 系统 协调 交 又 
路 口 时 间 。 这 意味 着 整个 交通 系统 将 与 道路 上 的 所 有 汽车 实现 同步 。 
麻 省 理工 学 院 可 感知 实验 室 研究 科学 家 、 意 大 利 国家 研究 委员 会 会 员 
保罗 : 桑 蒂 (Paolo Santi) 表示 ， 将 交通 灯 更 换 成 基于 时 段 的 道路 系统 
可 以 极 大 地 提高 交叉 路 口 的 交通 性 能 ， 而 且 交通 堵塞 和 延误 现象 也 会 
随 之 消失 。 而 韩国 最 大 的 通信 运营 商 SK 厂 商 正在 测试 借助 5G 实 时 通信 
技术 将 汽车 与 其 他 车 辆 和 行人 连接 起 来 的 技术 ， 最 终 使 未 来 的 交通 不 
再 需要 交通 信号 灯 。 其 计划 2019 年 开始 为 主要 高 速 公路 推出 这 种 自动 
驾驶 服务 ， 然 后 将 服务 扩展 到 更 繁忙 的 街道 。 ( 见 图 5.22) 


图 5.22 不 再 有 交通 信号 灯 的 交叉 路 口 
图 片 来 源 ， 麻 省 理工 学 院 可 感知 城市 实验 室 。 


未 来 ， 只 有 智能 斩 驶 汽车 、 交 通 基 础 设施 、 车 联网 、 交 通 管 理 系 
统 整 体 协同 才能 让 每 个 公司 的 无 人 车 在 公平 的 规则 下 行使 ， 才 能 实现 
真正 的 智能 交通 ， 从 而 大 幅 提升 交通 效率 。 阿 里 巴巴 为 城市 交通 系统 
打造 了 一 个 “城市 大 脑 ”。2016 年 10 月 ， 该 系统 首先 在 杭州 测试 ， 通 过 
杭州 5 万 多 个 道路 摄像 头 做 信息 采集 ， 相 关 数 据 汇集 到 后 台 进 行 交 换 与 
处 理 ， 由 人 工 智 能 系统 做 出 算法 决策 ， 然 后 再 传 回 交 通 设 施 上 执行 ， 
可 以 对 整个 城市 进行 全 局 实时 分 析 ， 上 自动 调配 公共 资源 ， 在 部 分 路 段 
的 测试 过 程 中 , “城市 大 脑 ” 让 和 车辆 的 通行 速度 最 高 提升 了 119%“。 该 类 
系统 的 商用 也 将 大 幅 减 少 人 力 成 本 ， 阿 里 巴巴 视觉 计算 组 负责 人 介绍 
说 : “这 些 视频 如 果 由 交警 三 班 倒 地 去 看 ， 需 要 15 万 个 交警 ， 而 通过 算 
法 ， 城 市 大 脑 可 以 在 短 时 间 内 把 这 些 视频 都 看 完 ， 数 清楚 有 多 少 辆 车 
往 哪个 方向 走 了 。” 

高 级 辅助 要 驶 汽车 和 车 联网 结合 能 够 大 幅 降 低 城市 的 交通 事故 ， 
并 减少 车 辆 的 能 源 消耗 。 美 国 交通 部 基于 600 万 例 交通 事故 的 分 析 数 据 


显示 ，ADAS 《高 级 辅助 区 驶 系统 ) 的 使 用 能 够 降低 15% 的 交通 事 
故 ，V2X (车 联网 ) 的 使 用 能 够 降低 36% 的 交通 事故 ， 而 两 者 结合 能 
够 避免 96% 的 交通 事故 。 华 为 在 苏州 工业 园区 的 智慧 交通 测试 更 是 验 
证 了 这 个 说 法 。 因 为 车 联网 的 引入 ， 交 通 延 误 能 够 降低 15%， 主 干道 
平均 速度 提高 15%， 停 车 次 数 降 低 179%。 而 欧洲 一 个 团队 通过 车 联网 
让 车 辆 编队 行驶 ， 能 够 减少 车 辆 油耗 7%~15%， 减 少 人 力 成 本 40%。 


安防 


AI 在 打击 芍 怖 分 子 、 罪 犯 ， 预 测 突 发 情况 ， 管 理 密集 人 和 群 等 方面 
开始 发 挥 较 大 效用 。 图 像 识 别 技术 开始 让 城市 管理 系统 实现 目标 检测 
、 人 脸 识 别 (属性 提取 ) 、 目 标 分 类 (车 、 行 人 ) 等 功 
° 主要 用 在 运动 日 标 检测 、 周 边 入 侵 防 范 、 目 标识 别 、 车 辆 检测 、 
ee 
图 像 和 视频 识别 可 以 分 为 下 列 几 大 类 应 用 。 
(1) 人 脸 识 别 及 统计 (包括 层 语 识别 ) 。 
(2) 虹膜 指纹 识别 
(3) 表 情 识别 - 测 谨 仪 9 
(4) 物体 识别 及 动作 顺序 。 
(5) 网 络 特定 类 图 片 监控 。 
(6) 第 四 类 步 态 识别 。 
第 一 类 图 像 识 别 是 人 脸 识 别 。 全 世界 人 脸 识 别 最 大 的 市 场 是 中 
国 ， 人 脸 识 别 在 中 国 已 经 被 广泛 应 用 于 手机 支付 、ATM 机 、 门 禁 、 打 
卡 、 海 关 、 和 车 (机 ) 票 、 交 通 违规 监测 、 安 全 监控 等 。 人 脸 识别 甚至 
开始 应 用 于 快餐 店 ， 利 用 老 客 户 的 点 餐 习 惯 加 快 点 矢 速 度 。 人 脸 识 别 
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还 可 以 用 于 寻找 早年 被 抛 卖 的 儿 董 。 中 国 各 地 目前 有 大 约 1.8 亿 个 摄像 
头 ， 到 2020 年 将 增加 到 4.5 亿 个 ， 平 均 每 三 个 人 一 个 摄像 头 。 中 国 已 经 
建成 了 世界 上 最 大 的 视频 监控 网 “中 国 天 网 ”， 利 用 人 工 智 能 和 大 数据 
进行 警 务 预测 。2017 年 4 月 ， 深 圳 已 经 开始 利用 人 脸 识 别 技术 来 识别 乱 
罕 马 路 的 行人 。2016 年 ， 中 国安 防 行 业 市 场 规模 已 经 达到 5 400 亿 元 ， 
同比 增长 9%。 预 计 未 来 几 年 ， 中 国安 防 行业 市 场 规模 将 从 2015 年 的 近 
5 000 亿 元 增长 到 2020 年 的 8 759 亿 元 ， 年 增长 率 在 11% 以 上 。 


人 脸 识 别 的 主要 任务 有 两 类 : 一 类 是 在 一 组 未 知 的 图 像 中 找 出 是 
否 有 某 个 人 ; 男 一 类 是 判断 一 张 图 像 是 否 为 某 个 特定 的 人 。 传 统 的 目 
动 图像 识 别 分 为 以 下 几 步 。 

(1) 先 用 一 组 事先 定义 的 人 脸 特 征 把 将 要 识别 的 人 脸 进行 分 类 ， 
每 个 人 脸 都 表现 为 特征 集中 的 一 组 参数 。 

(2) 在 图 像 中 首先 识别 有 没有 人 脸 ， 如 果 有 ， 再 识别 在 图 像 中 的 
仁 冯 位 置 % 

(3) 提取 图 像 中 每 个 人 脸 的 特征 ， 将 这 些 特征 和 已 经 存在 于 数据 
库 的 各 个 人 脸 特 征 参数 进行 比较 ， 找 到 相似 度 最 高 的 人 脸 。 


而 深度 学 习 放 弃 了 使 用 事先 定义 好 的 人 脸 特 征集 ， 而 是 用 已 知人 
脸 图 像 去 训练 模型 。 目 前 ， 在 图 像 识 别 中 主要 使 用 CNN， 不 论 是 什么 
样 的 应 用 ， 都 是 先 有 一 组 已 经 标注 的 训练 图 像 ， 用 这 组 训练 图 像 将 
CNN 训 练 好 以 后 ， 用 CNN 来 识别 未 知 的 图 像 。 比 较 简单 的 应 用 是 个 人 
图 像 认证 ， 例 如 手机 刷 脸 密 码 。 这 种 应 用 的 图 像 清晰 (基本 都 是 对 着 
镜头 的 大 头 照 ) ， 而 且 只 需要 识别 是 否 为 某 一 个 人 ， 训 练 集 只 是 一 个 
人 的 不 同 照片 。 第 二 类 是 门禁 、 打 卡 、 车 票 等 系统 类 ， 需 要 识别 出 摄 
像 头 前 是 存在 数据 库 里 的 一 群 人 中 的 哪 一 位 。 这 两 类 应 用 都 是 被 识别 
人 “和布 望 被 认 出 来 "， 所 以 问题 相对 简单 。 比 较 困 难 的 是 “不 希望 被 认 出 
来 ”的 情形 ， 例 如 ， 在 公共 场合 的 摄像 头 里 监控 是 否 有 某 一 群 人 中 的 一 
个 或 几 个 出 现 。 挑 战 在 于 摄像 头 的 分 辨认 有 限 ， 被 摄影 人 离 镜头 的 距 
离 太 远 ， 光 线 和 绢 癌 、 姿 势 剖 有 许多 变化 ， 更 别提 如 末 化 妆 或 者 整形 


的 情况 了 。 假 设 摄 像 头 的 分 辨 率 为 1 920x1 080 (高 清 电视 ) ， 可 靠 地 
识别 一 个 人 脸 需 要 分 辨 率 不 低 于 100x100。 根 据 不 同 的 景深 和 画幅 ， 
当 人 脸 和 摄像 头 距离 10~20 米 时 ， 人 脸 识别 的 可 靠 性 吏 会 大 幅 下 降 。 吨 
外 摄像 头 的 安 夺 位 置 都 远 远 高 于 人 脸 ， 当 人 离 摄像 头 太 近 时 ， 头 顶 会 
记 挡 人 脸 。 总 体 来 说 在 一 个 公共 场合 ， 例 如 商场 或 广场 角落 的 摄像 头 
想 要 准确 识别 人 流 中 是 否 有 记录 在 案 的 人 是 一 件 非常 有 挑战 性 的 事 。 
站 纹 识别 和 虹膜 识别 的 原理 都 和 人 脸 识 别 类 似 ， 但 细 市 不 同 。 


目前 公共 场合 图 像 和 视频 监控 的 一 个 技术 发 展 方向 是 把 识别 能 
和 摄像 头 放 在 一 起 。 设 想 一 个 大 城市 有 上 百 万 个 摄像 头 ， 如 果 每 个 摄 
像 头 按 照 每 秒 64k 比 特 速 率 向 云端 传送 ， 每 天 就 会 产生 上 千 TB 的 数 
据 ， 无 论 是 处 理 还 是 储存 成 本 都 非常 高 。 更 重要 的 是 从 监控 特定 人 群 
的 角度 来 看 ， 这 些 数 据 绝 大 部 分 都 是 无 用 数据 。 如 果 识 别 能 力 放 在 摄 
像 头 端 ， 那 么 只 有 当 发 现 疑似 目标 时 才 会 上 传 数据 。 这 种 摄像 头 端 的 
识别 可 以 用 高 速 CPU 和 GPU 来 做 ， 但 价格 太 高 。 假 设 一 个 监控 点 的 整 
个 成 本 为 1 万 元 人 民 币 (包括 摄像 头 、 拉 电源 、 拉 网 线 、 安 装 费 用 ) ， 
识别 芯片 的 成 本 不 应 该 超过 2 000 元 人 民 币 。 而 且 耗 电 不 能 太 高 ， 因 为 
户外 环境 不 容易 安装 散热 设备 。 目 前 的 解决 方案 主要 是 FPGA (现场 可 
编程 门 阵 列 ) ， 但 当 算 法 稳定 和 标准 形成 后 ， 长 远 解决 方案 一 定 是 低 
功 耗 、 低 成 本 的 专用 芯片 。 设 计生 产 这 种 芯片 的 可 以 是 芯片 设计 厂 
商 ， 但 更 有 优势 的 是 那些 已 经 大 量 生产 和 部 署 摄像 头 的 公司 。 

人 脸 识 别 中 还 包括 表情 识别 和 层 语 识别 。 用 表情 识别 来 测度 可 能 
比 心电图 更 准确 。 由 于 表情 的 定义 本 身 比较 模糊 ， 分 类 也 很 有 挑战 ， 
所 以 很 难 男 外 取得 被 测 者 的 标注 数据 。 层 语 识别 是 一 项 集 机 器 视觉 与 
自然 语言 处 理 于 一 体 的 技术 ， 即 通过 人 的 口 型 变化 推测 说 了 什么 话 。 
早 在 2003 年 ， 英 特 尔 便 开发 了 “视听 说 识别 系统 ”软件 ， 供 开发 者 研制 
能 读 懂 “ 层 语 * 的 计算 机 。2016 年 ， 谷 歌 DeepMind 英 文 唇 语 识别 系统 便 
已 经 可 以 支持 17500 个 词 了 ， 新 闻 测 试 集 识别 准确 率 达 50% 以 上 。 目 
前 口 型 识别 的 准确 率 能 够 达到 约 60%。2017 年 12 月 ， 搜 狗 推 出 了 中 文 
版 的 唇 语 识别 ， 可 以 直接 从 有 人 讲话 的 视频 中 ， 通 过 识别 说 话 人 的 唇 


部 动作 ， 来 解读 说 话 者 所 说 的 内 容 。 通 过 端 到 端 深 度 神 经 网 络 技术 进 
行 中 文 唇 语序 列 建 模 ， 经 过 数 千 小 时 的 真实 唇 语 数 据 训 练 ， 打 造 了 一 
个 “导语 模型 "*， 在 非特 定 人 开放 口语 测试 集 上 ， 该 系统 达到 60% 以 上 
的 准确 率 ， 在 垂直 场景 命令 集 例 如 车 载 、 智 能 家 居 等 场景 下 甚至 已 经 
达到 90% 的 准确 率 。 ( 见 图 5.23) 

第 二 类 图 像 识 别 是 物体 识别 和 统计 。 例 如 在 卫星 照片 中 识别 地 面 
有 多 少 架 飞 机 、 分 别 是 什么 型 号 ， 地 铁 站 每 天 有 多 少 乘客 ， 商 场 有 多 
少 特定 类 型 的 顾客 (例如 年 轻 女 性 ) 等 。 有 挑战 的 是 在 视频 中 识别 一 
个 物体 的 某 个 部 位 的 连续 动作 ， 例 如 识别 一 个 挖掘 机 铲 斗 在 一 个 时 间 
段 里 控 握 了 多 少 斗 矿石 。 


0-_e0e 


图 片 来 源 :搜狗 。 
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图 5.23 唇 语 识别 技术 原理 


第 三 类 图 像 识别 是 识别 出 网 络 中 上 传 的 图 像 或 视频 是 否 
如 黄色 图 片 。 这 种 应 用 也 相当 有 挑战 性 ， 原 因 之 一 是 被 识别 
易 清 晰 界定 (比如 到 奈 什 么 算 黄 色 ) ， 原 因 之 二 是 训练 集 可 
大 ， 使 训练 和 识别 的 成 本 都 非常 高 。 


第 四 类 图 像 识 别 古 步 态 识别 ， 中 国 科 学 院 研 究 出 了 一 种 新 兴 的 生 
物 特征 识别 技术 一 一 步 态 识别 。 该 技术 只 看 走路 的 姿态 ， 在 50 米 内 ， 
及 两 下 眼睛 的 时 间 ， 摄 像 尖 束 能 准确 辨识 出 特定 对 象 ， 即 使 但 挡 了 面 
部 也 有 效 。 虹 膜 识别 通常 需要 目标 在 30 厘 米 以 内 ， 人 脸 识 别 需 在 5 米 以 
内 ， 而 步 态 识别 在 超 高 清 摄 像 尖 下， 识别 距离 可 达 50 米 ， 识 别 速 度 在 
200 毫 秒 以 内 。 此 外 ， 步 态 识 别 无 须 识 别 对 象 主动 配合 ， 即 便 一 个 人 在 
几 十 米 外 戴 着 面具 育 对 普通 监控 摄像 头 随意 走动 ， 步 态 识 别 算法 也 可 
以 对 其 进行 身份 判断 。 步 态 识别 还 能 完成 超大 范围 人 群 密度 测算 ， 能 
够 对 100 米 外 或 者 1 000 平 方 米内 的 上 千 人 进行 实时 计数 。 这 些 技 术 能 
广泛 应 用 于 安防 、 公 共 交 通 、 商 业 等 场景 。 


违规 ， 例 
类 别 不 容 
能 


会 非常 


预测 定理 


2014 年 12 月 31 日 晚间 发 生 在 上 海外 滩 的 踩踏 事件 ， 造 成 365 人 死 
亡 ，49 人 受伤 。 其 原因 束 是 跨 年 夜 活动 引发 了 相当 多 的 游客 光临 ， 而 
城市 管理 者 不 清楚 人 流 密度 ， 从 而 没有 及 时 芷 散 ， 该 类 问题 随 着 AI 的 
到 来 将 逐步 得 到 解决 。AI 结 合 大 数据 技术 ， 已 经 能 够 在 城市 的 人 流 预 
测 、 天 气 预 测 、 灾 害 预 测 等 方面 发 挥 作用 。 微 软 亚 洲 研 究 院 借 助 
CNN、RNN 技 术 与 城市 的 数据 ， 已 经 能 够 成 功 预测 未 来 十 几 个 小 时 的 
城市 人 流 情 况 、 筋 狂 发 生 概 率 等 ， 这 将 在 一 定 程度 上 改写 城市 的 管理 
了 

微软 亚洲 研究 院 以 贵阳 出 租车 的 实时 数据 为 样本 ， 基 于 人 工 吞 
能 、 云 计算 、 大 数据 做 了 实时 的 人 流量 预测 系统 。 系 统 把 城市 划 成 1 
000 米 x 1 000 米 的 格子 ， 预 测 每 个 格子 里 面 未 来 会 有 多 少 出 租车 进 


出 。 每 个 格子 颜色 不 同 ， 代 表 了 不 同 的 信息 ， 每 点 一 个 格子 殉 会 跳出 
一 个 图 形 和 表格 ， 能 清楚 知道 整个 城市 某 个 区 域 人 群 流动 接 下 来 十 几 
个 小 时 会 呈现 什么 状态 。 比 如 已 经 发 生 过 的 出 租车 进出 情况 ， 未 来 的 
和 人流 情况 ， 昨 天 同一 时 间 的 情况 等 。 同 样 地 ， 任 何人 流 预 测 数 据 来 
源 ， 比 如 手机 信和 号、 地铁 刷卡 记录 等 ， 都 可 以 通过 该 系统 模型 进行 运 
算 从 而 得 到 某 地 将 有 多 少 人 进出 的 结果 ， 并 预测 未 来 十 几 个 小 时 的 城 
市 人 流 情况 。 微 软 亚 训 研究 院 的 孝 宇 博 士 领导 了 这 个 全 究 ， 该 研究 成 
果 《 城 市 人 群 流动 的 深度 时 空 预测 网 络 》 ( Deep Spatio-Temporal 
Residual Networks for Citywide Crowd Flows Prediction) 已 经 发 表 在 第 
31 届 人 工 智能 大 会 AAAI-17 上 。 ( 见 图 5.24) 
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图 5.24 贵 阳 实 时 人 流量 预测 系统 
图 片 来 源 ， 微 软 亚洲 研究 院 。 
未 来 这 个 方 同 的 研究 还 会 有 更 深远 的 发 展 ， 该 研究 已 经 可 以 用 来 
预测 城市 擂 用 等 空气 质量 情况 。 未 来 应 该 还 可 以 预测 几 天 内 有 无 大 其 
雨 ， 基 于 城市 基础 设施 ， 预 测 哪些 地 方 会 被 淹 ， 哪 些 地 方 排水 不 够 


4 。 
于 


重复 体力 劳动 者 将 被 机 器 人 全 面 蔡 代 


机 器 人 中 最 大 的 一 支 就 是 自动 驾驶 汽车 ， 因 为 这 个 产业 太 大 , 通 
常 大 家 把 它 专门 拿 出 来 研究 。 不 算 自 动 芍 驶 汽车 和 无 人 机 的 机 器 人 市 
场 到 底 有 多 大 ? IDC 研 究 报告 预计 ， 到 2019 年 全 球 机 器 人 市 场 规模 将 
达到 1 350 亿 美元 ，2015 年 全 球 机 器 人 文 出 为 710 亿 美元 ， 并 将 以 17% 
的 年 复合 增长 率 增长 。 


这 个 市 场 主要 包括 三 个 类 型 : 装配线 机 器 人 、 (与 人 ) 合作 型 机 
硬 人 、 上 日 主 型 机 寓 人 。 洲 配 线 机 器 人 的 特点 是 动作 程式 化 ， 并 且 不 需 
要 判断 。 根 据 工业 装配 线 的 事先 设计 要 求 给 机 器 人 输入 指令 后 ， 机 咒 
人 一 直 做 重复 性 的 动作 。 合 作 型 机 寓 人 主要 是 和 人 一 起 完成 生产 线 上 
的 任务 ， 由 人 来 做 复业 和 需要 判断 的 事情 ， 由 机 天 做 蔷 兰 但 重复 性 强 
的 工作 。 合 作 型 机 天 人 和 大 配 线 机 人 右 人 类 似 ， 但 是 因为 和 人 近 距 离 在 
一 起 操作 ， 所 以 需要 有 紧急 保护 攻 置 ， 以 防 伤 人。 人 工 知 能 影响 最 大 
的 是 目 主 型 机 器 人 ， 这 类 机 器 人 目前 主要 是 做 服务 型 工作 ， 例 如 商场 
导购 、 酒 店 门厅 接待 、 医 院 送 硕 械 和 药 、 小 区 巡逻 、 家 庭 卫 生 、 食 品 
制作 等 。 目 前 最 成 熟 的 是 扫地 机 融 人 ， 每 年 能 卖 出 上 千 万 台 ， 其 他 的 
都 还 不 成 熟 。 原 因 之 一 在 于 每 一 个 服务 项 目的 感知 、 判 断 和 行动 决策 
都 很 复杂 ， 与 目 动 当 驶 类 似 ， 如 果 成 本 太 高 ， 束 没有 经 济 价值 。 服 务 
型 机 絮 人 的 第 二 个 问题 是 如 何 和 现 有 流程 配合 。 例 如 小 区 人 巡逻， 如 琳 
机 妖 人 无 法 一 次 取代 保安 的 所 有 复杂 工作 ， 那 么 机 器 人 如 何 和 小 区 保 
安 分 工 协调 ?故障 和 维修 如 何 解 决 ? 自主 型 机 器 人 未 来 的 主要 市 场 仍 
然 古 工 业 和 生产线。 目前 高 产值 重型 狠 配 ， 例 如 汽车 ， 已 经 越 来 越 多 地 
使 用 机 器 人 ， 但 许多 低产 值 的 轻型 装配 还 需要 使 用 大 量 人 工 。 随 着 机 
硕 人 成 本 的 降低 ， 这 类 生产 线 也 将 逐渐 配备 机 器 人 。 男 一 类 是 非 效 本 
型 的 生产 线 ， 例 如 食品 加 工 、 禽 畜 层 衬 、 货 物 分 拣 等 。 这 些 工作 在 理 
论 上 都 能 逐渐 被 机 器 人 取代 ， 前 提 古 一 台 机 器 人 的 成 本 低 于 一 个 生产 
工人 的 1~2 年 的 工 痪 福利 。 在 技术 上 要 求 这 类 机 器 人 有 一 定 的 视觉 感 


知 ， 较 快 的 处 理 速度 。 最 重要 的 是 机 严 人 大 脑 软 件 必须 适应 性 极 强 ， 
能 够 在 现场 设置 匹配 各 种 不 同 的 生产 过 程 或 者 能 够 学 习 新 技能 ， 而 不 
必 为 每 个 生产 流程 专门 制作 软件 。 这 要 求 开发 出 一 款 通 用 机 器 人 大 脑 
软件 ， 包 括 通 用 的 感知 、 判 断 和 控制 ， 并 且 能 够 方便 地 设置 成 不 同 的 
应 用 场景 。 可 以 预见 ， 能 开发 出 这 种 软件 的 公司 将 有 巨大 的 商业 前 
景 。 与 此 同时 ， 一 个 能 够 朔 在 大 批 中 低 端 目 主 型 机 句 人 上 的 将 感知 、 
控制 、 通 信和 都 集成 到 一 起 的 低 成 本 芯片 也 会 很 有 商业 前 景 。 


打通 巴 别 塔 一 — 黑 天 牧 杀 手 级 应 用 


当 所 有 人 对 AI 的 注意 力 都 集中 在 诸如 自动 萄 独 、 人 脸 识 别 等 “ 低 垂 
果实 * 上 时 ， 一 场 最 深刻 的 章 命 很 可 能 发 生 在 卓然 语言 翻译 和 理解 领 


域 。 这 场 单 命 可 能 改变 目 几 十 万 年 前 智 人 发 出 第 一 声 有 意义 的 “ 呼 
哼 ” 以 来 的 人 类 文明 史 。 人 类 有 可 能 第 一 次 无 障碍 地 协同 兰 起 一 座 “ 巴 
别 搭 ”。 一 旦 语言 的 隔离 被 打破 ， 文 化 的 隔 头 也 将 在 几 代 人 之 间 补 剖 
破 。 


图 5.25 巴 别 塔 

图 片 来 源 : http://nolabelsnolies.com/different-tower-of-babel/。 

笔者 2015 年 在 巴西 目 驾 旅行 时 须 稀 不 可 离 的 就 古 手 机 里 的 合 歌 翻 
译 应 用 。 巴 西 能 讲 英 语 的 人 不 多 ， 不 论 是 租车 还 是 住 店 ， 笔 者 都 要 掏 
出 手机 给 谷歌 翻译 说 一 通 英 语 让 手机 翻译 成 葡萄 牙 语 ， 然 后 拿 痢 手机 
给 对 方 播放 ， 再 让 对 方 对 痢 手 机 说 一 通 簿 萄 牙 语 ， 翻 译 后 对 着 目 己 播 
放 。 由 于 翻译 得 不 准确 ， 加 上 现场 的 噪声 ， 来 回 让 双方 对 痢 手机 麦克 
风 等 ， 使 用 体验 非常 莽 ， 但 比 没有 要 强 很 多 。 这 里 面 有 很 多 技术 问题 
需要 解决 ， 能 够 使 翻译 体验 流畅 的 最 低 要 求 有 以 下 几 点 。 


(1) 不 需要 拿 着 手机 来 回 对 着 双方 。 理 想 化 的 器 件 是 一 个 挂 在 脖 
子 上 的 小 项 链 ， 或 者 是 一 个 远 小 于 手机 的 可 以 放 在 对 话 双 方 之 间 的 小 
盒子 ， 里 面 有 像 亚马逊 智能 音箱 Echo 那样 的 扬声器 和 多 声 道 麦 克 风 可 
以 聚焦 讲话 者 的 声音 ， 滤 除 现场 噪音 。 


(2) 不 需要 每 说 一 句 话 都 要 按 一 次 “翻译 ?或 “播放 ”。 翻 译 机 和 活 
人 翻译 一 样 ， 只 要 检测 到 说 话 者 的 停顿 或 一 段 完整 意思 的 结束 ， 马 上 
忠 开 始 播 放 翻 译 。 

(3) 必须 能 够 离线 。 当 手机 没有 联网 信号 时 ， 手 机 里 的 存储 内 容 
和 计算 能 力 足 够 一 些 常 用 的 翻译 。 

(4) 翻译 准确 率 达 到 99%。 自 从 2017 年 初 谷歌 将 翻译 后 台 从 传统 
的 统计 方法 改 为 神经 网 络 翻 译 后 ， 准 确 率 大 大 提高 。 随 着 翻译 量 的 增 
多 ， 相 信 以 目 前 的 神经 网 络 和 计算 能 力 ， 已 足够 应 对 日 常生 活 (例如 
旅行 ) 的 翻译 。 但 是 要 进行 专业 或 和 历史 文化 深刻 联系 的 翻译 ， 还 需 
要 一 定 的 努力 。 

以 上 只 是 对 一 个 翻译 机 最 低 的 要 求 ， 进 一 步 的 要 求 是 这 个 翻译 机 
在 生活 中 “ 隐 去 ”， 成 为 日 常 罕 戴 的 一 部 分 。 例 如 做 成 极 小 的 像 助 听 器 
那样 的 器 件 ， 通 过 手机 和 网 络 相 连 ， 可 以 做 到 无 颖 的 “ 同 声 传译 *， 并 
在 同 声 传译 时 可 以 抵消 对 方 发 出 的 原声 ， 即 “原声 抵消 ”， 做 到 听 者 只 
能 听 到 翻译 而 不 被 原声 干扰 。 


要 做 到 以 上 无 终 、 流 畅 的 翻译 ， 基 础 的 技术 都 已 经 成 熟 或 接近 成 
熟 。 主 要 的 技术 难点 有 以 下 几 个 。 

(1) 微型 多 声 道 抗 噪 远 场 声音 检测 技术 。 

(2) 目前 亚马逊 的 Echo 已 经 具备 了 多 声 道 抗 噪音 和 说 话 者 方向 聚 
焦 功能 ， 但 这 些 功能 还 需要 进一步 改进 。 包 括 能 够 识别 不 同 的 人 ， 不 
必 每 次 喊 cAlexa” (亚马逊 语音 助理 ) ， 能 在 更 嘲 杂 的 环境 下 识别 语 
音 ， 最 重要 的 是 进一步 微型 化 。 

(3) 语义 理解 。 神 经 网 络 在 短 短 的 几 年 内 大 大 提高 了 语音 识别 的 
准确 率 ， 但 是 语义 理解 仍然 是 瓶颈 。 对 着 机 器 翻译 说 一 大 段 话 ， 机 器 
翻译 会 党 的 。 

(4) 学 习 “ 主 人 ”的 背景 和 个 性 ， 以 便 更 透彻 地 理解 每 一 句 话 。 


机 器 翻译 的 进一步 发 展 是 在 文化 背景 方面 远 超 人 类 。 例 如 一 个 英 
文 翻译 如 采 不 是 在 美国 长 大 ， 即 使 阅读 量 很 大 ， 也 有 文化 育 景 的 隔 
疝 。 例 如 当 大 家 谈论 起 儿 十 年 前 的 一 个 电影 镜头 ， 或 某 场 棒球 比赛 的 
一 个 击 打 ， 或 者 一 个 南部 地 区 的 生 爸 伸 语 时 ， 翻 译 整 不 履 了 。 一 个 没 
在 中 国生 活 过 的 汉语 翻译 也 存在 同样 的 问题 。 而 像 海 强 一 样 大 量 吸收 
痛 景 知识 恰恰 是 机 器 学 习 的 强项 。 可 以 预见 未 来 的 机 莫 翻译 束 像 一 个 
同时 在 两 个 国家 长 大 的 孩子 一 样 熟 悉 双方 的 历史 和 文化 。 

机 器 翻译 未 来 还 会 增加 一 项 人 类 做 不 到 的 功能 ， 就 古 提前 熟悉 对 
方 的 背景 。 当 人 类 进行 一 次 重要 会 见 或 谈判 时 ， 都 会 事先 做 功课 了 解 
对 方 。 人 类 人 花 几 天 做 的 事 ， 机 器 可 以 一 秒 做 完 。 

根据 目前 人 工 智能 心 片 和 算法 的 发 展 ， 随 映 翻译 可 以 在 5 ~10 年 内 
实现 ， 能 超越 人 的 翻译 可 以 在 20 年 左右 实现 。 

一 旦 无 颖 、 流 畅 的 同 声 翻 详实 现 了 ， 对 世界 的 影响 就 是 巨大 的 。 
目前 虽然 交通 和 通信 将 物理 距离 缩短 ， 增 加 了 人 类 的 交流 和 分 工 合 
作 ， 但 是 语言 阳 闵 仍然 古 最 主要 的 障碍 。 中 国 目前 有 上 亿 人 出 国旅 
游 ， 大 部 分 古 跟 团 游 ， 如 果 有 了 无 颖 、 流 畅 的 翻译 ， 到 外 国 和 到 中 国 


一 个 省 的 感觉 一 样 ， 那 么 很 多 人 会 选择 自助 游 。 商 业 的 交流 成 本 也 会 
大 幅 降 低 ， 到 任何 其 他 国家 工作 都 没有 语言 障碍 。 这 种 无 颖 、 流 畅 的 
同 声 翻译 冲击 最 大 的 是 文化 和 身份 认同 。 今 天 世界 民族 主义 回潮 ， 民 
族 国 家 的 界限 主要 以 语言 和 文化 进行 划分 ， 当 这 层 墙 被 拆 掉 后 ， 今 天 
的 民族 国家 是 否 还 会 存在 ? 2017 年 10 月 Google 发 布 了 一 款 与 智能 手机 
配套 的 智能 耳机 ， 在 谷歌 语音 技术 、 翻 译 技 术 的 文 持 下 ， 这 歌 小 小 的 
耳机 可 以 实现 40 种 语言 实时 翻译 功能 ， 虽 然 不 是 非常 准确 ， 但 是 基本 
的 旅游 度假 还 是 可 以 你 证 的 。 ( 见 图 5.26) 


图 5.26 谷 歌 的 实时 翻译 耳机 


无 颖 、 流 畅 的 同 声 翻 译 最 终 会 导致 全 球 文化 多 样 性 的 消失 吗 ? 不 
会 。 原 因 是 每 个 人 讲 的 和 听 的 仍然 是 目 己 的 母语 。 人 类 将 生活 在 一 
种 “ 双 层 社会 中， 一 层 是 “世界 大 同 层 "”， 大 家 各 目 说 着 目 己 的 母语 ， 
但 十 规则 和 习惯 逐渐 融合 ， 男 一 层 古 “本 土家 乡 层 ”， 各 目的 习俗 仍然 
不 同 。 只 要 没有 超级 规模 的 人 类 大 迁徙 和 混合 ， 各 种 母语 文化 仍然 会 


继续 生长 。 这 并 不 奇怪 ， 其 实 今天 人 类 在 世界 范围 内 的 商业 活动 已 经 
征 使 用 和 遵循 共同 的 规则 了 。 


全 方位 冲击 


AI 对 各 个 产业 的 影响 只 是 开端 。 任 何 一 个 行业 只 要 在 运行 过 程 中 
产生 大 量 数据 ， 束 可 能 被 AI 优化 和 部 分 (或 者 全 部 ) 自动 化 。 如 果 这 
个 行业 资金 多 ， 那 么 更 会 吸引 一 系列 新 创 公 司 进 入 这 个 行业 来 题 履 。 
除了 我 们 在 前 面 讨论 的 交通 运输 、 医 疗 健康 、 金 融 服 务 等 行业 之 外 ， 
下 列 行业 也 将 不 可 避免 地 受到 AI 的 冲击 。 


制造 业 


除了 生产 线 、 装 配 线 继续 大 量 使 用 机 器 人 人 以外， 制造 业 的 供应 链 
管理 、 营 销 也 将 大 量 采 用 AI。 阿 里 巴巴 的 福 T 工 业 大 脑 * 帮 助 协 乌 光 伏 
的 民品 率 提升 1% ， 一 年 节省 上 亿 元 成 本 对 整个 中 国 制造 业 而 言 意味 
着 巨大 的 利润 增长 空间 。 


批发 零售 业 


目前 批发 零售 业已 经 受到 互联 网 的 严重 冲击 ， 互 联网 公司 由 于 从 
诞生 之 日 起 束 拥 有 数据 且 会 利用 数据 ， 将 率 允 采用 AI 继续 颠 履 零售 
业 。AI 正 在 积极 影响 零售 业 的 运输 、 和 定价 与 促销 、 供 应 商 互 动 和 管理 
决策 等 环节 。 据 麦肯锡 测算 ， 基 于 AI 的 需求 预测 方法 比 传统 方法 的 预 
测 误差 减 少 30%~70%， 由 于 产品 无 效 性 导致 的 销售 损失 可 以 降低 


659%。 今 天 亚马逊 和 阿里 巴巴 的 无 人 零售 店 只 是 端倪 ， 目 动 当 驶 送 货 
上 上门 和 裔 地 开花 的 目 动 售 货 店 有 可 能 彻 故 取代 传统 零售 业 。 


法 律 


IBM、 阿 里 巴巴 、 科 大 讯 飞 在 法 条 的 查找 、 审 判 记录 等 方面 开始 
使 用 AI。IBM 的 沃 森 系 统 可 以 帮助 找到 “判例 法 ”， 帮 助 律师 找到 更 有 
力 的 证 据 。 知 识 产 权 律 师 可 以 用 AI 自动 查找 过 往 的 专利 ， 搜 索 专 利 违 
反 和 版 权 唱 客 事 件 ， 甚 至 能 起 草 专 利 申请 。 


广告 定 饥 


Facebook 通 过 AI 技术 扫描 用 户 的 状态 更 新 、 上 传 的 图 片 、 视 频 ， 
签到 ， 点 贯 ， 甚 至 是 Linked Apps (连接 应 用 ) 等 相关 数据 ， 能 够 生成 
用 户 的 数字 档案 和 用 户 画 像 ， 从 而 实现 智能 投放 和 精准 的 稍 销 服务 。 
视频 广告 领域 Vediot+ (智能 广告 位 识别 投放 与 营销 解决 方案 公司 ) 利 
用 AI 为 客户 在 网 络 剧 、 节 目 直 播 中 寻求 到 精准 的 广告 投放 。 


房地产 


无 人 机 监理 、 机 器 人 巡逻 、 建 筑 、 工 程 监理 、 房 屋 销售 和 租赁 、 
物业 管理 等 一 系列 环节 将 被 AI 优化 或 取代 。 


政府 和 公用 事业 


政府 的 运行 ， 特 别 是 对 市 民 的 服务 将 会 大 量 自动 化 ， 市 政 管理 包 
括 交通 管理 、 警 察 、 安 全 监控 等 将 会 大 量 使 用 AI 。 
国防 军事 

用 来 自动 驾驶 汽车 的 技术 也 可 以 用 来 驾驶 坦克 。 无 人 机 已 经 成 了 
美国 反恐 战争 的 重要 武器 ， 按 现在 的 发 展 速度 ， 下 一 场 空战 将 不 会 再 
有 飞行 员 。 我 们 在 下 一 章 还 会 详细 讨论 AI 对 战争 的 影响 。 
旅游 


未 来 你 的 个 人 智能 助理 比 家 人 还 熟悉 你 ， 你 只 要 说 “ 想 去 巴西 玩 一 
周 ”， 所 有 的 行程 整 都 安排 好 了 。 


教育 


“高 考 机 右 人 ?能够 比 高 中 毕业 生 考 取 更 高 的 分 数 只 是 同 大 众 演示 
AI 的 可 能 性 。 真 正 的 冲击 是 在 目前 在 线 教育 内 容 基 础 上 的 、 个 性 化 的 
智能 老师 、 目 动 评测 和 答疑 等 。 当 个 性 化 智能 教育 发 展 到 一 定 程度 ， 
很 有 可 能 会 彻 故 旺 履 目前 的 教育 ， 例 如 分 散 的 虚拟 学 习 社区 有 可 能 取 
代 集 中 式 的 学 校 ， 按 需 学 习 的 终身 教育 有 可 能 取代 小 学 到 大 学 的 专门 
教育 。 


农业 


今天 的 农业 已 经 开始 大 规模 使 用 无 人 机 等 先进 技术 ， 天 气 、 土 
二 、 农 作物 、 市 场 信息 等 可 以 帮助 农民 更 精准 地 种 植 。 


油耗 16 英 里 /加 仑 ，2017 年 电费 0.25 美 


假设 汽油 3 美元 /加 仓 ， 特 斯 拉 同 等 级 汽油 车 ; 

元 / 度 ， 特 斯 拉 4 英 里 / 度 ， 所 以 每 16 英 里 的 成 本 是 0.25x4=1 美 元 ， 这 样 每 驾驶 同样 16 英 里 
距离 的 4 度 电 可 以 比 一 加 仑 油 省 2 美元 ， 这 样 电池 成 本 相当 于 12 000 美 元 /2 美元 =6 000 加 
仑 ，6 000x16=96 000 英 里 ， 一 辆 车 平均 轨 驶 10 万 英里 。 所 以 正好 把 电池 成 本 赚 回 来 。 


(1 英里 =1.609 千 米 ) 


1. 


AI 的 作用 将 不 止 于 颠覆 商业 ， 还 会 有 更 深刻 和 长 期 的 影响 。 
本 章 仙 员 开 脑 洞 ， 理 解 了 本 章 束 能 知道 下 一 代 该 如 何 做 好 准备 。 
这 一 章 也 可 以 直接 跳 进 来 读 ， 但 最 好 能 先 读 前 两 章 。 


我 们 在 上 一 章 摘 述 了 AI 在 短期 内 会 对 商业 和 生活 造成 的 影响 ， 但 
我 们 很 难 想象 更 长 期 (30~50 年 ) 的 影响 。 虽 然 预测 长 远 的 未 来 很 难 ， 
但 是 如 果 能 深刻 理解 AI 的 本 质 ， 束 能 对 未 来 的 方向 有 感觉 。2007 年 苹 
果 手 机 的 发 布 开 司 了 移动 互联 网 的 一 波 巨 泥 ， 当 时 对 移动 互联 网 有 两 
种 不 同 的 观点 。 一 种 观点 认为 移动 互联 网 和 个 人 电脑 互联 网 有 完全 不 
同 的 性 质 ， 会 出 现 全 新 的 杀手 级 应 用 。 男 一 种 观点 (主要 是 个 人 电脑 
互联 网 的 部 分 大 佬 ) 认为 手机 无 非 是 个 人 电脑 的 延伸 ， 比 原来 的 网 
站 、 搜 索 和 游戏 等 多 了 一 块 显示 屏幕 而 已 。 笔 者 是 中 国 最 早 从 事 移动 
互联 网 的 专业 人 士 ， 基 于 手机 和 个 人 电脑 的 本 质 区 别 在 于 手机 的 定位 
功能 ， 笔 者 曾经 预测 未 来 杀手 级 应 用 一 定 和 定位 功能 有 关 ， 而 且 不 会 
是 当时 大 家 都 能 想到 的 找 加 油 站 、 订 和 餐馆 这 样 的 * 浅 层 定 位 应 用 ”， 也 
一 定 会 产生 者 的 巨头 。 采 不 其 然 ， 出 行 类 的 应 用 成 为 移动 互联 网 的 杀 
手 级 应 用 ， 创 造 出 了 Uber、 滴 滴 出 行 这 样 的 个 人 电脑 互联 网 巨头 之 外 
的 新 的 移动 互联 网 巨头 。 


基于 深度 学 习 的 AI 本 质 


效 据 之 间 相 天 性 的 发 现 和 记忆 


读 过 人 第 三 章 的 读者 能 体会 到 神经 网 络 最 本 质 的 特点 是 发 现 并 记忆 
数据 中 的 相关 性 。 例 如 ， 看 了 很 多 汽车 的 图 片 后 吏 会 发 现 汽车 都 有 四 
个 轮子 。 人 的 大 脑 对 图 片 这 类 直观 的 数据 间 的 相关 性 也 能 发 现 一 部 分 
并 记 住 ， 这 避 是 默 知 识 。 但 当 数据 量 很 大 ， 又 不 直观 时 ， 例 如 股票 市 
场 的 数据 、 复 洒 系 统 (例如 人 体 、 核 电站 ) 内 部 的 数据 ， 人 就 不 行 
了 。 而 神经 网 络 却 应 付 目 如 ， 一 眼 束 能 发 现 数据 之 间 的 关系 并 记 住 ， 
这 束 是 暗 知识 。 下 回 再 遇 到 类 似 的 数据 ， 马 上 束 能 做 出 判断 。 随 痢 神 
经 网 络 的 规模 增 大 〈 神 经 元 数目 和 神经 元 之 间 的 连接 数目 ) ， 机 响 能 
够 处 理 人 根本 无 法 企及 的 大 规模 的 复杂 数据 。 


海量 记忆 基础 上 的 细微 老 别 的 识别 


机 器 学 习 需 要 大 量 的 数据 ， 主 要 是 让 机 器 “看 到 、 记 住 * 数 据 中 呈 
现 出 的 各 种 模式 。 有 点 像 小 孩 玩 万 花 简 ， 数 据 就 是 装 入 万 花 简 中 的 彩 
色 玻璃 碎片 ， 不 停 地 转动 玻璃 楼 镜 就 是 不 同 的 算法 (对 应 神经 网 络 中 
不 同 的 连接 ) 。 一 组 有 限 的 数据 中 埋藏 着 无 数 排列 组 合 出 来 的 图 样 。 
因为 机 器 的 记忆 比 人 的 记忆 准确 ， 而 且 量 大 ， 机 器 可 以 每 秒 转 几 亿 次 
万 花 简 ， 很 快 就 能 看 完 并 且 记 住所 有 的 图 样 。 所 以 机 器 学 习 可 以 发 现 
数据 中 隐藏 的 所 有 细微 区 别 。 

基于 以 上 原理 ， 机 器 学 习 适 合 做 极其 复杂 的 决策 ， 例 如 制定 像 健 
康 保险 这 样 极其 复杂 的 公共 政策 ， 策 划 诸 如 诺曼底 登陆 这 样 包含 大 量 
变量 的 军事 行动 。 


这 两 个 AI 的 本 质 其 实 也 正 是 上 暗 知识 的 两 个 特点 。 基 于 以 上 两 个 特 
点 ， 我 们 看 看 未 来 会 出 现 哪些 远 超人 类 的 颠 履 性 的 超级 应 用 。 


科研 加 速 


一 个 科学 研究 的 过 程 可 以 分 为 以 下 儿 个 步骤。 
(1) 提出 问题 或 选择 要 解决 的 问题 。 

(2) 学 习 研 究 关 于 这 个 问题 已 经 发 表 的 研究 文献 。 

(3) 根据 研究 文献 和 研究 者 的 经 验 提 出 假设 。 

(4) 设计 验证 假设 的 实验 。 

(5) 进行 实验 和 整理 实验 数据 。 

(6) 根据 实验 结果 判断 假设 是 否 成 立 。 

(7) 如 果 假 设 不 成 立 ， 返 回 第 (2) 步 或 第 (3) 步 ， 提 出 新 的 假 


在 这 个 流程 中 最 花 时 间 的 有 三 个 环节 : 人 研究 文献 、 做 实验 和 整理 
数据 。 在 这 三 个 环节 中 ， 机 器 学 习 都 可 以 部 分 甚至 全 部 取代 人 。 获 取 
相关 的 文献 ， 阅 读 、 理 解 并 总 结 已 经 成 为 科研 的 瓶颈 之 一 。 根 据 涯 太 
华 大 学 的 研究 ， 自 从 1965 年 以 来 共有 5 000 万 篇 科学 文章 发 表 ， 现 在 每 
年 新 发 表 的 文章 是 250 万 篇 。 关 于 某 个 能 够 抑制 癌 细 胞 的 蛋白 质 的 论文 
就 达到 70 000 篇 。 一 个 科学 家 即使 一 天 读 10 篇 文献 ， 每 个 工作 日 都 
读 ， 一 年 也 只 能 读 2 500 篇 ， 所 以 大 部 分 的 研究 结果 都 会 被 束 之 高 阁 。 
使 用 AI 可 以 通过 自然 语言 理解 找到 相关 的 所 有 文献 。 例 如 一 个 叫 作 Iris 
( 艾 瑞 斯 ) 的 AI 软件 可 以 这 样 做 科研 : 首先 从 一 个 关于 这 个 研究 题目 
的 演讲 开始 。 这 个 演讲 通常 是 本 领域 的 一 位 著名 科学 家 做 的 几 十 分 钟 
的 概述 性 报告 ， 例 如 TED (美国 著名 讲坛 ) 大 会 的 演讲 。Iris 先 使 用 自 


然 语 言 处 理 算法 分 析 演 讲 的 脚本 ， 挖 握 从 开放 渠道 获取 的 学 术 文 献 ， 
查找 到 与 讲座 内 容 相 天 的 关键 论文 ， 然 后 将 相关 的 研究 论文 分 组 并 进 
行 可 视 化 ，Iris 目 前 可 以 达到 70% 的 准确 率 ， 下 一 步 是 用 人 工 帮助 标注 
文献 使 机 器 匹配 精度 增加 。 当 机 妖 能 够 理解 文献 的 内 容 和 结构 时 ， 至 
少 可 以 帮助 科学 家 总 结 出 在 一 个 科研 领域 中 已 经 提出 的 问题 ， 已 经 提 
出 过 的 假设 及 其 验证 ， 已 经 做 过 的 实验 和 结 采 。 机 器 甚至 能 根据 文章 
的 逻辑 目 洽 性 对 文 草 结 末 提 出 疑问 。 用 机 器 阅读 文献 的 一 个 重要 作用 
征 能 够 对 前 人 的 工作 一 览 无 余 ， 不 至 于 做 许多 重复 性 的 工作 。 


今天 的 科研 越 来 越 依赖 于 实验 ， 而 实验 的 准备 、 操 作 和 数据 整理 
经 党 耗 时 耗 力 。 机 大 学 习 可 以 大 大 加 快 实验 进程 。2001 年 的 诡 贝 尔 物 
理 奖 颁发 给 了 美国 的 埃 里 克 : 康 条 尔 (Eric Comell) 等 三 位 实验 物理 学 
家 。 他 们 的 成 果 是 用 激光 器 和 人 磁场 创造 出 了 目 然 界 不 存在 的 物质 的 第 
四 种 状态 : 玻 色 - 爱 因 斯 坦 凝聚 态 。 物 质 在 目 然 界 的 三 种 状态 根据 温度 
不 同 分 别 是 固态 、 液 态 和 气态 。 当 角度 降低 至 非常 接近 绝对 零度 时 
(实验 上 永远 无 法 达到 绝对 零度 ， 物 质 就 会 进入 凝聚 态 (一 种 气态 
的 、 超 流 性 的 物质 状态 ) 。 凝 聚 态 物 质 有 很 多 特性 ， 例 如 对 地 球 磁极 
和 引力 场 极为 敏感 ， 光 线 在 该 物质 中 会 延迟 ， 等 等 。 基 于 印度 科学 家 
玻 色 的 计算 ， 爱 因 斯 坦 于 1924 年 预测 了 这 种 物质 的 存在 以 后 ， 科 学 家 
一 直 想 在 实验 室 验 证 出 来 。1995 年 ， 这 三 位 科学 家 经 过 多 年 的 实验 ， 
用 一 套 非 常 复杂 的 实验 装置 终于 制造 出 了 物质 的 凝 察 态 。 图 6.1 是 这 个 
实验 的 示意 多 ， 透 镜 内 有 一 小 块 物质 ， 透 镜 外 有 许多 激光 束 。 油 光 打 
在 物质 上 可 以 约束 物质 内 分 子 的 运动 ， 从 而 降低 物质 的 温度 。 图 6.2 是 
实验 设备 的 核心 部 分 ， 图 6.3 古 实验 设备 的 全 貌 。 可 以 看 出 ， 这 套 实验 
装置 非常 复杂 ， 可 以 设置 的 参数 非常 多 ， 如 果 每 一 种 参数 的 排列 组 合 
都 去 试 ， 到 宇宙 终结 可 能 都 试 不 出 来 。 而 人 有 许多 直觉 可 以 大 大 加 快 
实验 。 获 交 的 三 位 物理 学 家 措 索 了 很 多 年 才 终 于 造 出 了 凝 案 态 。2016 
年 5 月 17 日 ， 来 目 澳大利亚 新 南 威尔士 大 学 和 澳大利亚 国立 大 学 的 研究 
团队 使 用 机 器 学 习 从 头 开 始 操作 这 样 的 实验 (反复 设置 调整 实验 设备 
的 各 种 参数 直到 产生 凝聚 态 物 质 ) ， 机 器 学 习 竟然 不 到 一 个 小 时 就 成 


功 制造 出 了 这 种 凝聚 态 物 质 。 该 团队 希望 通过 进一步 借助 AI 以 更 快 的 
速度 构建 更 大 的 这 类 物质 。 


图 6.1 凝 聚 态 设 备 示意 图 : 不 同方 向 的 激光 束 约束 分 子 运 动 造成 凝聚 态 物质 〈 腔 体内 ) 


图 片 来 源 : https://plato.stanford.edu/entries/physics-experiment 。 


图 6.2 凝 聚 态 实 验 设备 的 核心 部 分 


图 片 来 源 : https://plato.stanford.edu/entries/physics-experiment ° 


图 6.3 凝 育 态 实验 设备 全 貌 


图 片 来 源 : https://plato.stanford.edu/entries/physics-experiment 。 

科学 实验 的 第 三 个 环节 是 收集 整理 数据 ， 这 更 是 AI 的 优势 。 其 实 
在 科学 界 目前 还 有 一 个 瓶颈 惑 是 人 研究 论文 的 审核 ， 要 发 表 的 论文 太 
多 ， 能 有 水 平和 时 间 对 其 进行 审核 的 人 太 少 。 机 妖 学 习 可 以 大 大 加 快 
个 过 程 ， 例 如 可 以 检查 该 论文 是 否 抄 和 缆 或 者 和 已 经 发 表 的 结果 有 冲 


er a 
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科学 研究 中 最 难 被 机 器 取代 的 是 提出 假设 ， 但 是 IBM 的 一 个 团队 
宣称 他 们 的 系统 可 以 做 到 。 也 束 是 说 ， 他 们 的 AI 可 以 通过 挖掘 学 术 文 
献 目 动产 生 科 学 假设 。 而 且 ， 宣 称 他 们 的 算法 可 以 用 来 做 出 新 的 科学 
发 现 。 他 们 的 目标 是 将 文本 控 气 与 可 视 化 和 分 析 结 合 起 来 ， 以 便 识 别 
事实 ， 并 提出 “新 的 、 有 趣 的 、 可 以 测试 的 、 可 能 十 真实 的 ”假设 。 

人 类 过 去 500 年 来 的 进步 主要 依靠 科学 技术 的 进步 ， 而 且 这 种 进步 
还 在 加 速 。 随 着 AI 的 发 展 ， 科 学 发 现 可 能 会 加 速 ， 这 意味 着 技术 进步 
会 进一步 加 快 ， 反 过 来 又 会 加 快 科学 的 进步 。 例 如 量子 计算 依赖 于 材 
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人 
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料 科 学 的 进展 ， 一 旦 量子 计算 取得 突破 ， 计 算 能 力 残 可 能 比 现在 提高 
几 个 数量 级 ，AI 能 力 的 提高 义 会 进一步 加 快 科 学 进展 和 加 速 实验 速 
度 ， 如 此 循环 下 去 。 

另外 一 个 加 速 是 用 AI 改进 AI。 谷 歌 和 Facebook 都 开始 赋 究 目 动机 
器 学 习 ， 通 过 强化 学 习 的 模型 ， 让 机 器 不 仅 不 断 地 调整 参数 ， 而 且 能 
够 选择 不 同 的 神经 网 络 模型 。 在 很 多 情况 下 自我 学 习 的 性 能 都 可 以 和 
人 设计 出 来 的 性 能 相 比 ， 机 器 有 时 还 会 选择 人 类 想不到 的 模型 ， 甚 至 
有 人 开始 探索 如 何在 机 器 学 习 里 模仿 人 类 的 想象 和 创新 。2017 年 底 ， 
谷歌 推出 由 AI 自主 “孕育 ?出 的 * 子 AP， 该 * 子 AP 被 取 名 为 "NASNet”， 
研究 人 员 在 ImageNet 图 像 分 类 和 COCO 目标 识别 两 个 数据 集 上 ， 对 
NASNet 进 行 了 测试 ， 在 验证 集 上 的 预测 准确 率 达 到 了 82.7%， 比 之 前 
公布 的 人 工 智 能 产品 的 结果 好 1.2%， 效 率 也 提高 了 4%。 目 前 这 些 研究 
还 处 在 早期 阶段 。 一 旦 这 类 循环 加 速 技术 成 熟 ， 就 会 使 技术 迅速 达到 
一 个 新 的 高 度 。 

科学 的 本 质 是 受 控 实验 。 人 类 通过 控制 一 组 变量 (例如 物理 实验 
中 的 物体 位 置 和 受 力 等 ， 化 学 实验 的 温度 和 压力 等 ) 来 测量 另外 一 些 
变量 (例如 物理 实验 中 物体 的 速度 ， 化 学 实验 中 的 气体 体积 ) 的 变 
化 。 科 学 定律 就 是 可 控 变 量 和 测量 变量 之 间 的 关系 。 当 人 类 完全 掌握 
了 某 一 类 关系 后 ， 就 可 以 通过 制造 仪器 把 原来 的 测量 变量 变 为 可 控 变 
量 ， 用 增 大 的 可 控 变 量 集 再 来 继续 发 现 它们 和 新 的 测量 变量 的 关系 ， 
这 就 是 科学 进步 的 本 质 ， 所 以 仪器 承 是 某 一 类 科学 定律 的 物化 。 科 学 
的 进展 完全 依赖 于 能 否 完全 掌握 某 个 科学 定律 并 且 把 该 定律 变 成 仪 
器 。 所 以 科学 的 进展 可 以 分 为 三 个 步骤 。 

(1) 提出 假设 : 某 一 组 可 控 变 量 和 男 一 组 可 测量 变量 可 能 的 关 


pr 
(2) 设计 实验 : 验证 可 挖 变量 和 可 测 变量 之 间 的 关系 。 


(3) 如 果实 验 不 能 验证 ， 束 重新 问 到 步骤 (1) 。 如 果 能 够 验 
证 ， 束 把 验证 过 的 关系 制造 成 仪器 ， 使 原来 的 可 测 变 量变 为 可 挥 变 


量 。 然 后 回 到 步骤 (1) 。 


机 器 学 习 在 每 个 步 又 中 都 能 加 快速 度 。 在 步骤 〈1) ， 机 器 学 习 可 
以 通过 阅读 历史 文献 提出 大 量 可 能 的 组 合 。 虽 然 在 大 量 的 备 选 假设 中 
最 终 还 要 科学 家 定 守 为 哪个 做 实验 ,但 机 右 可 以 帮助 科学 家 想 得 更 全 
面 。 在 步骤 (2) 最 论 时 间 的 是 改变 可 控 变 量 的 值 来 测量 可 测 变量 ， 这 
正 是 机 器 的 拿手 好 戏 。 在 收集 、 整 理 、 分 析 数 据 方面 机 絮 比 人 要 快 ， 
也 更 准确 。 在 步骤 (3) 制造 仪器 方面 又 分 为 设计 、 实 验 和 制造 三 个 步 
骤 ， 机 需 学 习 在 实验 和 制造 上 都 能 加 快速 度 。 可 以 想象 在 不 久 的 将 来 
会 出 现 “ 机 器 人 人 研究生 ”"， 人 类 科学 家 给 机 吕 一 个 大 致 的 研究 方 喇 ， 当 
机 器 遇 到 困难 时 请 教 一 下 导师 ， 剩 下 的 大 部 分 镀 究 工 作 避 © 是 机 絮 目 己 
做 了 。 它 们 不 知 疲倦 ，7 x24 小 时 做 研究 ， 阅 读 速 度 是 人 类 研究 生 的 一 
亿 倍 ， 测 量 分 析 数 据 速度 是 人 类 研究 生 的 一 万 倍 。 只 要 有 电力 和 算 
力 ， 世 界 上 可 以 有 几 十 亿 个 这 样 的 “人 研究生 ”在 研究 人 类 关心 的 各 种 课 


题 。 


唐诗 高 手 


机 融 学 习 不 仅 在 科学 技术 的 进步 上 大 显 神威 ， 而 且 也 开始 进入 人 
文 领域 。 下 面 的 四 首 律 请 中 有 两 首 是 人 写 的 ， 两 站 是 机 器 写 的 。 


云 峰 


日 云 生 处 起 高 峰 ， 
时 乔 神 工 造 化 成 。 
古往今来 谁 可 上 ， 
九重 训 阙 握 权 衔 。 


孤 耐 竣 市 扩 ， 
根 校 术 落 无 。 
寒 花 影 里 月 ， 
独 照 一 灯 村 。 


幽 径 重 寻 赌 胜 苔 ， 
倚 剧 犹 似 待 君 来 。 
此 生 永 失 天 人 台 路 ， 
老 风 秋 梧 各 目 衰 。 


春 雪 


飞 伦 轻 酒 雪 欺 红 ， 
雨 后 春 风 细 柳 工 。 
一 夜 东 君 无 限 恨 ， 
不 知 何 处 砚 青 松 。 


在 告诉 读者 答案 之 前 ， 先 看 看 机 器 写 计 的 原理 。 把 机 器 写 诗 的 原 
理 讲 得 最 清楚 的 莫 过 于 《红楼 梦 》 里 的 林 俭 玉 。 在 《红楼 梦 》 第 四 十 
八 回 中 ， 被 薛 宝 似 市 进 大 观 园 的 姑 妇 香 委 让 集 玉 教 她 写 诗 : 


做 玉 道 : “什么 难事 ， 也 值得 去 学 ! 不 过 是 起 承 转 合 ， 当 中 承 
转 钙 两 副 对 子 ， 平 声 对 大声， 虚 的 对 实 的 ， 实 的 对 虚 的 ， 帮 是 果 有 
了 奇 句 ， 连 平 人 虚实 不 对 都 使 得 的 。” 香 获 笑 道 :“ 怪 道 我 常 弄 一 本 
旧 诗 偷 空 儿 看 一 两 首 ， 又 有 对 的 极 工 的 ， 又 有 不 对 的 ， 又 听见 
说 ' 一 二 五 不 论 ， 二 四 六 分 明 *。 看 古人 的 诗 上 亦 有 顺 的 ， 亦 有 二 四 
六 上 错 了 的 ， 所 以 天 天 疑惑 。 如 今 听 你 一 说 ， 原 来 这 些 格调 规矩 疯 
征 末 事 ， 只 要 词句 新 奇 为 上 。” 集 玉 道 : “正和 是 这 个 道理 ， 词 句 抑 竞 
还 古林 事 ， 第 一 立意 要 紧 。 帮 意趣 真 了 ， 连 词句 不 用 修饰 ， 目 是 好 
的 ， 这 叫 作 ‘不 以 词 害 意 '。” 香 获 笑 道 :“ 我 只 爱 陆 放 俩 的 证 “ 重 帘 不 
卷 留 香 久 ， 古 砚 微 是 案 淮 多 '， 说 的 真有 趣 ! ” 袋 玉 道 : “ 断 不 可 学 
这 样 的 诗 。 你 们 因 不 知 译 ， 所 以 见 了 这 浅 近 的 吏 爱 ， 一 入 了 这 个 格 
局 ， 再 学 不 出 来 的 。 你 只 听 我 说 ， 你 大 真心 要 学 ， 我 这 里 有 《 王 摩 
计 全 集 》 你 且 把 他 的 五 言 律 读 一 百 首 ， 细 心 撕 摩 透 部 了 ， 然 后 再 读 
一 二 百 首 老 杜 的 七 言 律 ， 次 再 李 青 过 的 七 言 绝句 读 一 二 百 首 。 肚 子 
里 和 完 有 了 这 三 个 人 作 了 底子 ， 然 后 再 把 陶渊明 、 应 殊 ， 谢 、 阮 、 
庚 、 鲍 等 人 的 一 看 。 你 又 是 一 个 极 聪 敏 伶 便 的 人 ， 不 用 一 年 的 工 
夫 ， 不 愁 不 是 诗 全 了 ! ” 


人 氏 玉 说 的 第 一 件 事 是 格律 ， 押 前 合 办 ， 平 人 对 仗 。 这 是 律诗 的 基 
本 规则 ， 属 于 作 诗 的 明知 识 。 而 词语 之 间 的 相关 性 ， 也 即 一 个 词 出 现 
在 男 一 个 词 后 面 的 概率 ， 对 诗人 来 说 则 是 默 知识 。 学 习 这 些 默 知识 是 
机 器 最 擅长 的 ， 机 器 通 过 大 量 的 阅读 ， 对 每 个 词 后 面 出 现 什 么 词 部 有 
了 “感觉 ”。 集 玉 说 的 第 二 件 事 是 训练 集 要 大 ， 要 多 样 化 。 陆 游 一 生 写 
了 万 余 首 诗 ， 但 一 个 请 人 和 毕竟 有 局 限 性 ， 例 如 陆游 的 诗 题 材 单调 ， 意 
境 空 珠 。 如 果 香 净 只 学 陆游 的 证 束 会 像 黛 玉 说 的 那样 “一 入 了 这 个 格 
局 ， 再 学 不 出 来 的 "， 这 就 古 机 絮 学 习 里 面 当 训练 数据 集 太 小 时 出 现 
的 “过 度 拟 合 ” 问 题 。 所 以 集 玉 让 香 攻 学 王 维 、 杜 甫 、 李 日 等 不 同 风 格 
的 诗人 ， 王 维 的 空灵 幽 远 ， 杜 甫 的 斐 天 司 人 ， 李 日 的 满 酒 聚 放 ， 都 会 
避免 “过 度 拟 合 "， 多 种 风格 的 混合 才能 出 新 意 。 


机 器 作 诗 的 原理 和 人 学 作 诗 类 似 ， 本 质 上 也 是 模式 识别 ， 通 过 大 
量 学 习 识 别 然后 记忆 平 人 人 、 对 使 、 押 韵 、 词 句 的 常见 组 合 ， 即 一 个 词 
出 现在 另 一 个 词 后 面 的 概率 。 诗 歌 是 文字 的 一 部 分 ， 是 一 个 前 后 有 相 
关 性 的 序列 数据 流 ， 第 三 草 里 提 到 过 ，RNN 最 适合 序列 数据 处 理 。 产 
生 诗 歌 的 思路 有 两 种 。 第 一 种 思路 是 将 诗歌 的 整体 内 容 作 为 训练 语 料 
送 给 RNN 语 言 模型 进行 训练 。 训 练 完 成 后 ， 先 给 定 一 些 初始 内 容 ， 然 
后 残 可 以 按照 语言 模型 输出 的 概率 分 布 进行 采样 得 到 下 一 个 词 ， 不 断 
地 重复 这 个 过 程 就 产生 完整 的 诗歌 。 具 体 步 又 如 下 : 首先 由 用 户 给 定 
的 关键 词 生 成 第 一 句 ， 然 后 由 第 一 句 话 生成 第 二 句 话 ， 由 第 一 句 话 和 
第 二 句 话 生 成 第 三 句 话 ， 重 复 这 个 过 程 ， 直 到 诗歌 全 部 生成 。 该 模型 
由 三 部 分 组 成 。 

(1) 卷 积 语句 模型 (Convolutional Sentence Model，CSM) : 这 
个 卷 积 模型 用 于 获取 一 句 话 的 问 量 表示 。 

(2) 复发 上 下 文 模型 (Recurrent Context Model，RCM) : 句子 
级 别 的 RNN， 根 据 历 史 生 成 句子 的 癌 量 ， 输 出 下 一 个 要 生成 句子 的 上 
下 文 回 量 。 

(3) 复发 生成 模型 (Recurrent Generation Model，RGM) : 字符 
级 别 的 RNN， 根 据 RCM 输 出 的 上 下 文 癌 量 和 该 句 之 前 已 经 生成 的 字 
从， 输出 下 一 个 字符 的 概率 分 布 。 解 码 的 时 候 根 据 RGM 模 型 输出 的 概 
率 和 语言 模型 概率 加 权 以 后 ， 生 成 下 一 句 诗 歌 ， 由 人 工 规则 保证 押 
前 。 

第 二 种 思路 是 把 写 诗 看 成 一 个 翻译 过 程 。 将 上 一 句 看 成 源 语言 ， 
把 下 一 句 看 成 目标 语言 ， 用 机 需 翻 译 模型 进行 翻译 ， 并 加 上 平 八 押韵 
等 约束 ， 得 到 下 一 句 。 通 过 不 断 地 重复 这 个 过 程 ， 得 到 一 首 完 整 的 诗 
歌 。 

现在 到 了 揭 开 谜底 的 时 候 : 第 二 首 和 第 四 首 诗 是 机 器 写 的 ， 仔 细 
看 还 是 能 看 出 来 。 一 首 好 诗 首 先是 要 语句 目 然 流畅 ， 莫 境 浑 然 天 成 。 
第 二 首 的 第 一 句 “ 孤 耐 次 和 护 ? 根 本 不 知 所 云 。 除 了 句子 不 通顺 ， 两 首 


机 需 写 的 诗 还 很 难 让 读者 有 画面 感 。 一 首 好 诗 重 要 的 是 意境 ， 正 如 集 
玉 所 说 : “词句 完 葛 还 是 林 事 ， 第 一 立意 要 紧 。 大 意趣 真 了 ， 连 词句 不 
用 修饰 ， 目 是 好 的 ， 这 叫 作 ' 不 以 词 害 意 '。” 目 前 机 右 写 诗 像 一 个 缺乏 

资 的 但 极为 刻 否 的 证 歌 爱好 者 ， 怎 么 做 都 无 法 有 “意境 "。 能 够 打动 
人 的 好 诗 需 要 “ 触 景 生 情 ”"， 并 且 能 引起 读者 的 共鸣 。 这 更 是 目前 机 器 
学 习 还 无 法 企及 的 境界 。 最 绝妙 的 诗歌 除了 以 上 几 点 ， 还 要 能 出 奇 出 
新 ， 打 破 利 规 ， 使 用 从 来 未 使 用 过 的 词句 组 合 但 又 合情合理 。 正 如 集 
玉 在 进一步 提 点 香 帮 时 所 说 : 


“可 领略 了 些 滋味 没有 ? ” 香 净 笑 道 :“ 领 略 了 些 滋味 ， 不 知 可 
是 不 是 ， 六 与 你 听 听 。?” 黛 玉 笑 道 : “ 正 妥 讲究 讨论 ， 方 能 长 进 。 你 
且说 来 我 听 。” 香 帮 舌 道 : “ 据 我 看 来 ， 诗 的 好 处 ， 有 口 里 说 不 出 来 
的 意思 ， 想 去 却 是 远 真 的 。 有 似乎 无 理 的 ， 想 去 竟 是 有 理 有 情 
的 。” 集 玉 笑 道 : “这 话 有 了 些 意 思 ， 但 不 知 你 从 何 处 见得 ? ” 香 萎 
舌 道 : “我 看 他 《 塞 上 》 一 首 ， 那 一 联 云 : “大 注 诉 烟 直 ， 长 河 落 日 
。 "想来 烟 如 何 直 ? 日 目 然 古 圆 的 : 这 ' 直 ' 字 似 无 理 ，' 圆 ' 字 似 太 
俗 。 合 上 书 一 想 ， 倒 像 是 见 了 这 景 的 。 知 说 再 找 两 个 字 换 这 两 个 ， 
竞 再 找 不 出 两 个 字 来 。 还 有 “渡头 余 落 日 ， 址 里 上 孤 烟 ”: 这 ' 余 ' 字 
和 上” 字 ， 难 为 他 怎么 想来 ! 我 们 那 年 上 素来 ， 那 日 下 晚 便 湾 住 
船 ， 岩 上 又 没有 人 ， 只 有 几 棵 树 ， 远 远 的 几 家 人 家 做 晚 版 ， 那 个 烟 
竟 是 外 青 ， 连 云 直上 “。 谁 知 我 昨日 晚上 读 了 这 两 句 ， 倒 像 我 又 到 了 
那个 地 方 堆 开 ”” 


上 面 香 攻 喜 欢 的 这 些 诗句 都 超越 了 技巧 层面 ， 进 入 灵感 和 画面 的 
幽 微 层面 。 这 些 都 不 是 今天 以 学 习 数 据 之 间 相 关 性 为 特征 的 机 器 学 习 
所 能 企及 的 。 所 以 真正 的 诗人 完全 不 必 担 心 被 AI 取代 ， 但 那些 无 病 只 
吟 ， 婴 鹉 学 舌 或 天 次 平平 的 证 歌 爱好 者 只 能 和 机 器 诗人 去 PK 了。 

同样 的 道理 ，AI 还 可 以 写 小 说 。 只 要 让 机 器 大 量 阅 读 一 位 作者 的 
者 作 ， 机 器 瑟 能 学 会 这 个 作者 的 文字 风格 。 和 作证 、 男 男 一 样 ， 如 末 


让 机 器 阅读 了 许多 作家 的 书 ， 机 器 的 写作 风格 就 是 “混搭 ”的 。 和 作 诗 
一 样 ， 机 右 写 的 小 说 可 能 情 市 完整 ， 文 字 通 畅 ， 但 永远 不 会 有 伟大 作 
家 笔下 流 消 的 情感 和 内 烁 的 灵魂 。 

有 读者 一 定 会 问 ， 这 些 “ 灵 感 ” 和 “和 意境” 是否 也 是 一 种 默 知 识 ， 其 
至 瞳 知识 ? 当 机 器 更 复 洒 时 是 否 终 将 能 模仿 ? 这 个 问题 并 不 容易 回 
答 。 但 暂时 的 回答 古 “ 不 能 ”原因 古今 天 的 机 器 没 有 目 我 意识 ， 所 以 
没有 情感 。 我 们 在 本 书 的 最 后 会 讨论 这 个 问题 。 


真 假 凡 :高 


同样 的 原理 ， 机 器 在 看 过 大 量 的 绘画 作品 后 也 能 够 模仿 画家 的 风 
格 。 图 6.4 是 一 张 典 型 的 北欧 城市 图 片 
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图 6.4 一 张 典型 的 北欧 城市 图 片 


片 来 源 : https://www.businessinsider.com.au/the-science-how-vincent-van-gogh-saw-theworld- 
2015-9° 


机 器 可 以 把 这 张 图 片 改造 成 凡 .高 的 风格 。 图 6.5 左 边 是 凡 . 高 的 名 
画 《星空 》， 右 边 就 是 北欧 城市 图 片 的 "星空 化 。 
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图 6.5 用 几 : 高 名 画 《 星 空 》 风 格 画 的 北欧 城市 


图 片 来 源 : Leon Gatsy of Bethge Lab in Germany https://www.businessinsider.com.au/thescience- 
how-vincent-van-gogh-saw-the-world-2015-9。 


机 器 当然 也 可 以 把 这 张 图 片 “ 马 带 斯 化 ”"， 图 6.6 中 左边 是 号 带 斯 的 
| ER 厦 边 和 还 古 那 洲 北 欧 城市 图 。 


图 6.6 用 马 带 斯 风格 画 的 北欧 城市 


图 片 来 源 : Leon Gatsy of Bethge Lab in Germany https://www.businessinsider.com.au/thescience- 
how-vincent-van-gogh-saw-the-world-2015-9。 


从 这 两 张 改造 的 画 来 看 ， 机 器 的 模仿 可 以 说 是 惟妙惟肖 ， 其 中 色 
彩 、 笔 触 、 线 条 的 模仿 是 人 类 无 法 企及 的 。 这 种 模仿 是 典型 的 默 知 
识 ， 从 这 个 例子 可 以 看 出 机 需 对 默 知 识 的 掌握 比 人 类 要 精细 得 多 。 
AI 不 仅 会 模仿 ， 而 且 会 创造 目 己 的 风格 。 网 6.7 是 来 自 罗 格 斯 大 学 
计算 机 系 艺 术 与 人 工 物 能 实验 室 、Facebook 人工 智能 研究 院 
(FAIR) 、 查 尔 斯 顿 学 院 艺 术 史 系 三方 联 合 小 组 用 机 器 生成 的 绘画 。 
该 研究 小 组 在 论文 中 称 ， 该 研究 中 提出 的 人 工 智能 系统 是 一 个 创意 性 
的 对 抗 网 络 (Creative Adversary Network，CAN) ， 它 是 在 之 前 介绍 
过 的 生成 式 对 抗 性 网 络 系统 的 一 种 扩展 。 
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图 6.7 创 意 对 抗 网 络 生成 的 图 画 

图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺 术 与 人 工 智能 实验 室 。 

生成 对 抗 网 络 能 够 大 代 进化 、 模 念 指 定数 据 特征 ， 已 经 是 公认 的 
处 理 图 像 生成 问题 的 好 方法 。 目 从 提出 以 来 相关 的 研究 成 采 不 少 ,在 
图 像 增强 、 超 分 辨 率 、 风 格 转换 任务 中 的 效果 可 谓 是 惊人 的 。 根 据 生 
成 对 抗 网 络 的 基本 结构 ， 鉴 别 右 要 判断 生成 器 生成 的 图 像 古 否 和 其 他 
己 经 提供 给 鉴别 器 的 图 像 是 同一 个 类 别 (特征 相符 ， 这 就 决定 了 最 
好 的 情况 下 输出 的 图 像 也 只 能 是 对 现 有 作品 的 模仿 。 如 果 有 创新 ， 就 


会 被 鉴别 万 识 别 出 来 ， 束 达 不 到 目标 了 。 因 此 用 生成 对 抗 网 络 生成 的 
亏 术 作品 也 束 注 定 会 缺乏 实质 性 的 创新 ， 艺 术 价值 有 限 。 图 6.8 是 用 生 
成 对 抗 网 络 模 型 实现 的 图 像 分 辨 率 增 强 和 风格 转换 。 

风格 转换 
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图 6.8 用 生成 对 抗 网 络 模型 实现 的 图 像 分 辨 率 增 强 和 风格 转换 

图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺 术 与 人 工 智能 实验 室 。 

为 了 使 艺术 品 更 具有 创造 性 ， 该 研究 团队 在 生成 对 抗 网 络 的 基础 
上 提出 了 创意 对 抗 性 网 络 ， 人 研究 团队 通过 15 一 20 世 纪 1 119 位 艺术 家 的 
81 449 幅 涵盖 了 多 种 风格 的 绘画 作品 训练 神经 网 络 。 然 后 邀请 人 类 参 
与 者 评 佑 人工 状 能 的 忆 术 作品 与 现实 艺术 家 的 两 组 作品 。 这 两 组 作品 
古 创造 于 1945 一 2007 年 的 抽象 表现 派 作品 ， 以 及 2017 年 巴塞 尔 艺 术 博 
览 会 作品 。 图 6.9 上 面 的 12 张 是 由 创意 对 抗 网 络 生成 的 人 类 评价 最 高 的 
画 ， 下 面 8 张 是 评价 最 低 的 画 。 图 6.10 就 是 历年 巴塞 尔 艺术 博览 会 的 获 
痰 作品 。 

可 以 看 到 ， 机 器 生成 的 艺术 作品 风格 非常 多 样 ， 从 简单 的 抽象 画 
到 复杂 的 线条 组 合 部 有 ， 内 容 层次 也 有 区 分 。 而 研究 人 员 也 发 现 它们 
的 系统 可 以 欺骗 人 类 观察 员 。 将 人 类 观 岁 艺术 家 创作 的 作品 和 机 器 创 


作 的 作品 时 的 反应 进行 对 比 ， 发 现 人 类 无 法 将 机 器 生成 的 作品 和 当代 
乙 术 家 以 及 一 家 顶级 达 术 傅 锅 会 上 的 作品 区 分 开 来 。 
< , 和 EE . 


图 6.9 由 创意 对 抗 网 络 生成 的 图 画 


图 6.10 历 年 巴塞 尔 博览 会 的 获奖 作品 


图 片 来 源 : 罗 格 斯 大 学 计算 机 系 艺 术 与 人 工 智能 实验 室 。 

创意 性 对 抗 网 络 是 如 何 工 作 的 呢 ? 与 生成 对 抗 网 络 系统 一 样 ， 创 
意 性 对 抗 网 络 也 使 用 两 个 子 网 络 。 鉴 别 絮 被 赋予 了 一 套 有 风格 标签 的 
海量 亏 术 作品 ， 例 如 文 乙 复兴 时 期 、 巴 洛 殉 风格、 印象 主义 或 表现 主 
义 ， 而 生成 夯 则 无 法 获得 任何 忆 术 作品 。 当 它 生 成 一 个 作品 时 ， 它 会 
从 鉴别 絮 接 收 两 个 信号 : 一 个 是 将 图 像 分 类 为 “ 乞 术 或 非 艺 术 ”， 男 一 
个 是 “能 否 分 辨 图 像 古 哪 种 艺术 风格 ”。 


“艺术 或 非 艺 术 ” 与 “能 否 分 辨 艺术 风格 ”是 两 种 对 立 的 信和 号， 前 一 
种 信号 会 迫使 生成 厚生 成 能 够 被 看 作 足 乞 术 的 岁 像 ， 但 是 假如 它 在 现 


有 的 乞 术 风格 范畴 中 束 达 到 了 这 个 目标 ， 鉴 别 磊 了 惑 能 够 分 辨 出 图 像 的 
艺术 风格 了 ， 然 后 生成 器 就 会 受到 惩罚 。 这 样 后 一 种 信号 束 会 让 生成 
絮 生 成 难以 分 辨 风格 的 作品 。 所 以 两 种 信号 可 以 共同 作用 ， 让 生成 右 
能 够 尽 可 能 探索 整个 创意 空间 中 忆 术 作品 的 范围 边界 ， 同 时 最 大 化 生 
成 的 作品 尽 可 能 游离 于 现 有 的 标准 忆 术 风格 之 外 。 


这 种 “创作 ”在 本 质 上 是 非常 隐蔽 的 一 种 “混搭 ”， 和 作 诗 一 样 ， 普 
通 人 很 难 分 辩 真 伪 。 判 断 诗 还 可 以 用 “意境 ”画面 感 ”， 而 判断 画 ， 特 
别 是 抽象 画 几 乎 没有 人 类 可 以 依赖 的 直觉 。 所 以 和 作 诗 机 严 人 不 同 ， 
这 里 的 作画 机 器 人 掌握 的 不 只 是 默 知识 ， 而 且 进 入 了 瞳 知识 的 领地 。 
所 以 由 对 抗 生 成 网 络 这 种 机 名 “混搭 * 并 送 代 出 来 的 画 的 确 可 以 
乱 * 真 ”。 这 样 的 机 器 可 以 在 短期 内 大 量 探索 不 同 的 风格 ， 让 艺术 家 选 
择 或 给 艺术 家 以 灵感 。 

基于 类 似 的 原理 ，AI 作 曲 也 到 了 几乎 可 以 乱 真 的 地 步 。AI 作 曲 领 
域 的 领先 公司 Aiva Technologies 创 造 了 一 个 AI 作曲 家 Aiva (Artificial 
Intelligence Virtual Artist， 人 工 智能 虚拟 艺术 家 ) ， 并 教 它 如 何 创作 十 
典 音 乐 。 而 古典 音乐 一 直 以 来 被 视 为 一 种 高 级 的 情感 艺术 ， 一 种 独特 
的 人 类 品质 。Aiva Technologies 已 经 发 布 了 第 一 张 专辑 ， 名 为 
Genesis， 专 辑 包含 不 少 单 曲 。 并 且 Aiva 的 音乐 作品 能 够 用 在 电影 、 上 了 
告 ， 甚 至 是 游戏 的 配乐 里 。2017 年 初 ，Aiva 通 过 法 国 和 卢森堡 作者 权 
利 协会 (SACEM) 合法 注册 ， 成 为 人 工 智能 领域 第 一 个 正式 获得 世界 
地 位 的 作曲 家 ， 其 所 有 的 作品 都 以 自己 的 署名 拥有 了 版权 。 

Aiva 背 后 使 用 了 强化 学 习 技 术 的 深度 学 习 算 法 。 强 化 学 习 告 诉 软 
件 系 统 接 下 来 要 采取 什么 动作 以 通过 最 大 化 其 “累积 次 励 * 来 达到 某 种 
目标 。 强 化 学 习 不 需要 标注 过 的 输入 和 输出 数据 ，AI 可 以 通过 数据 目 
行 改进 性 能 ， 这 使 AI 更 容易 捕获 在 创意 艺术 如 音乐 中 的 多 样 性 和 变 
化 。Aiva 束 是 通过 品读 巴赫 、 贝 多 分 、 莫 扎 特等 最 车 名 的 作曲 家 的 古 
典 乐章 的 大 数据 库 来 了 解 音乐 作品 的 艺术 性 ， 目 行 谱写 出 了 一 些 新 的 
乐曲 。 


美国 盏 方 曾 经 公布 了 一 段 无 人 机 打击 塔利班 武装 分 子 的 视频 。 在 
内 华 达 州 戈壁 滩 的 空调 机 房 中 ， 几 个 年 轻 军 人 坐 在 视频 终端 前 面 ， 操 
纵 痢 半 个 地 球 之 外 的 阿 富 主 山区 的 无 人 机 ， 当 视频 上 准确 锁定 地 面 的 
车 辆 目标 后 ， 操 作 员 就 像 打 视频 游戏 一 样 按 动手 柄 上 的 按钮 ， 塔 利 班 
的 军车 顿时 起 火 ， 没 死 的 塔利班 武装 分 子 跳 下 卡车 四 处 逃命 。 在 夜 视 
仪 下 ， 这 些 逃 命 的 塔利班 武装 分 子 像 在 日 入 一 样 看 得 清楚 ， 操 作 员 一 
一 锁定 他 们 ， 按 下 按钮 ， 目 标 变 成 一 团 火 海 。 这 里 的 操作 无 非 是 辨别 
和 锁定 目标 ， 具 有 人 工 稼 能 的 机 器 已 经 远 远 超出 人 类 。 内 华 达 机 房 的 
操作 员 完 全 可 以 被 取代 ， 一 切 由 机 融 完 成 。 


美国 空军 开发 的 一 款 叫 作 ALPHA 的 自动 飞行 软件 ， 不 仅 在 每 一 场 
和 真人 的 对 决 中 都 打败 了 空军 飞行 教练 员 ， 甚 至 该 软件 在 区 驶 一 染 比 
对 手 飞 行 速度 慢 ， 导 弹射 程 短 的 飞机 时 也 能 打败 对 于。 飞机 的 目 动 区 
驶 其 实 比 汽车 目 动 当 驶 更 适合 机 大 操 作 。 第 一 ， 飞 行 员 的 大 量 训练 时 
间 是 学 会 读 懂 敬 驶 舱 内 琳琅 满目 的 仪表 和 通过 各 种 仪表 数据 判断 该 如 
何 操作 ， 这 正 是 机 器 学 习 的 拿手 好 戏 。 第 二 ， 空 中 飞行 的 周边 环境 远 
远 比 地 面 区 驶 简单。 同时 ， 飞 机 上 的 各 种 传 感 絮 可 以 准确 地 感知 飞机 
的 空间 坐标 、 高 度 、 速 度 、 平 衡 、 风 力 、 温 度 等 ， 在 这 种 情况 下 的 各 
驶 非 第 适合 机 器 。 虽 然 空 战 中 的 周边 环境 瞬 尽 万 变 ， 但 仍然 不 会 像 地 
面 一 样 拥挤 。 第 三 ， 也 十 最 重要 的 一 点 ， 反 应 快 。 人 类 从 大 脑 判 断 到 
肌肉 动作 至 少 要 0.1~0.3 秒 的 时 间 ， 而 机 器 可 以 在 百 万 分 之 一 秒 内 完 
成 。 目 前 的 飞机 和 武志 系统 的 反应 时 间 都 以 人 类 反应 时 间 为 下 限 ， 因 
为 武 右 反应 再 快 人 跟 不 上 也 没 用 。 但 未 来 的 飞机 和 武器 设计 整 是 要 能 
够 达到 机 械 反 应 速度 的 极限 ， 因 为 作为 操控 员 的 人 工 闹 能 的 反应 时 间 
主要 是 计 算 时 间 ， 将 远 短 于 武 右 的 机 械 反 应 时 间 。 几 乎 可 以 预计 下 一 
代 军 用 飞机 将 以 目 动 和 目 主 性 操控 为 主 ， 一 加 人 类 轨 驶 的 飞机 一 定 打 
不 过 机 器 操纵 的 飞机 。 


目前 无 人 机 已 经 广泛 使 用 在 反 娩 和 局 部 侦察 与 战斗 中 ， 但 这 只 有 是 
序曲 。 以 人 工 智能 为 核心 能 力 的 新 型 武大 必 将 成 为 下 一 轮 军 备 竞 赛 的 
主要 目标 。 人工 智能 对 未 来 军事 和 战争 的 影响 将 主要 体现 在 以 下 方 
面 。 


新 型 自主 性 武 右 的 开发 


最 早 的 自动 化 的 武器 就 是 导弹 ,但 我 们 通常 并 不 把 导弹 称 为 人 工 
智能 武器 。 这 里 的 区 别 在 于 是 自动 化 (automated) 还 是 自主 化 
(autonomous) 。 自 动 化 是 确定 性 地 输入 感知 信号 产生 确定 性 的 输出 
反应 ， 而 目 主 化 是 不 确定 性 地 输入 感知 信号 产生 一 定 概 率 分 布 的 输出 
反应 信号 ， 甚 至 是 一 个 从 未 见 过 的 输入 ， 通 过 推理 、 常 识 和 经 验 产生 
一 个 最 佳 的 输出 。 五 角 大 楼 国防 科学 委员 会 在 2016 年 发 布 的 一 份 报告 
是 这 样 描述 的 :“ 要 实现 自主 ， 一 个 系统 必须 具备 基于 其 对 世界 、 自 和 刁 
和 形势 的 认识 与 理解 ， 独 立 构建 和 选择 不 同 的 行动 路 线 以 便 实 现 其 目 
标的 能 力 。” 一 个 预 移 设 定 了 打击 目标 的 导弹 是 自动 化 武器 ， 一 个 放飞 
到 塔利班 梨 穴 上 衬 的 会 随机 应 变 的 捕食 者 无 人 机 是 自主 性 武器 。 未 来 
自主 性 武 絮 将 率先 在 各 类 飞行 颖 上 全 面 普及 ， 进 而 开始 应 用 于 水 上 和 
水 下 ， 包 括 水 面 舰 船 与 潜艇 以 及 各 种 机 器 鱼 。 最 后 是 陆地 ， 包 括 车 
辆 、 坦 克 和 各 种 机 右 人 ， 台 、 狗 、 蛇 和 等。 目前， 以 色 列 已 经 部 署 了 一 
种 上 自主 的 防 辐 射 无 人 机 Harop， 可 以 飞行 长 达 6 个 小 时 ， 只 在 敌人 防 罕 
雷达 亮 起 的 时 候 进行 攻击 。 俄 罗斯 武器 生产 公司 Kalashnikov 已 经 制造 
出 了 一 把 全 上 自动 AK-47 步 枪 ， 通 过 使 用 AI 确定 目标 瞄准 射击 ， 而 该 武 
名 准备 癌 俄 罗斯 军 方 供应 。 


电池 容量 是 野战 机 器 人 的 笨 贷 


大 型 自主 性 武器 的 能 源 主要 还 是 热能 量 密度 高 的 石化 燃料 。 但 是 
内 燃 机 的 传动 远 不 如 电力 灵活 方便 ， 一 个 四 旋 经 的 无 人 机 要 用 内 燃 机 
驱动 传动 部 分 会 非常 复杂 。 所 以 很 多 小 的 自主 性 武器 例如 无 人 机 ， 机 
如 人 、 台 、 狗 、 蛇 等 最 理想 的 动力 来 源 是 电池 驱动 ， 但 是 以 目前 的 锂 
电池 容量 密度 ( 约 300 瓦 时 千克 ) 和 每 年 的 改进 程度 ( 约 5%) ， 在 
短期 内 很 难 有 能 够 支持 机 器 运行 长 达 一 天 的 电池 ， 在 野外 充电 和 换 电 
池 也 都 是 很 大 的 问题 。 除 了 锂电 池 ， 目 前 另 一 个 比较 有 希望 的 是 氢 燃 
料 电 池 ， 与 锂电 池 相 比 ， 其 优势 是 充电 快 ( 几 分 钟 而 不 是 几 个 小 
时 ) ， 单 位 体积 或 重量 的 能 量 密度 也 更 高 ， 所 以 未 来 军用 电池 很 可 能 
以 所 燃料 电池 为 主 。 


军用 技术 将 落后 于 民用 技术 


人 工 智能 和 电子 、 信 息 产 业 类 似 ， 由 于 该 技术 在 民生 中 的 巨大 商 
业 前 景 ， 民 用 和 商用 对 该 技术 的 总 投入 要 大 于 军事 上 的 投入 。 民 用 和 
商用 通过 市 场 竞 争 机 制 也 会 吸引 人 工 智 能 方面 一 流 的 人 才 (如 创业 的 
回报 巨大 ) 。 由 于 开放 性 的 学 术 交 流 和 开源 软件 ， 民 用 技术 将 进展 神 
速 ， 巨 大 的 商业 前 景 也 会 造成 空前 激烈 的 市 场 竞 争 。 这 一 切 都 会 推动 
人 工 智能 在 民用 和 商用 方面 快速 进展 。 而 军用 技术 的 发 展 则 会 落后 于 
民用 技术 ， 许 多 军用 技术 研发 最 便宜 的 方法 都 是 依托 在 民用 技术 之 
i 


大 规模 协同 作成 的 演进 


一 场 战役 的 规模 常 营 受信 息 获 取 和 传导 的 限制 。 在 今天 有 了 铺 兰 
天 地 的 无 线 通 信 后 ， 人 类 接收 信息 的 速度 和 反应 时 间 又 进一步 成 了 瓶 
贷 。 当 信息 接收 和 反应 都 由 机 器 接管 后 ， 一 次 战斗 和 战役 的 规模 可 以 


大 大 增加 。 如 有 果 都 是 机 器 之 间 互 相 协 调 ， 那 么 几 百 万 台 机 器 可 以 瞬间 
协同 行动 。 最 近 美 国 国防 部 新 型 武 右 人 研发 部 公布 了 一 段 几 百 台 微 型 无 
人 机 “群舞 ”的 视频 。 当 战斗 机 在 沙漠 中 撒 下 几 百 台 无 人 机 后 ， 这 些 无 
人 机 会 目 动 组 成 飞行 队 形 对 一 大 片 地 形 实 施 侦察 ， 还 可 以 随时 改变 队 
形 。 当 个 别 无 人 机 离队 时 ， 队 形 会 目 动 调整 ， 当 离队 的 无 人 机 回 到 和 群 
体 后 ， 队 形 又 会 目 动 改变 。5G 通 信 网 络 的 到 来 也 将 加 速 机 需 协 同 的 进 
程 。5G 的 高 带宽 、 低 功 耗 、 低 时 延 的 特点 能 够 保证 更 多 的 机 套 以 更 少 
的 耗 电 量 ， 做 出 更 为 敏捷 的 协作 。2018 年 韩国 平 昌 冬 奥 会 ， 在 5G 试 验 
网 络 的 支持 下 ， 英 特 尔 公司 用 1 218 架 无 人 机 组 成 了 奥运 五 环 、 运 动 
员 、 和 平 名 等 图 案 进 行 灯光 秀 表 演 ， 刷 新 了 “同时 放飞 数量 最 多 的 无 人 
机 ”的 吉 尼 斯 世界 纪录 。 ( 见 图 6.11) 
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图 6.11 在 韩国 平 昌 冬 奥 会 上 1 218 架 无 人 机 组 成 的 奥运 五 环 


图 片 来 源 : https://zhuanlan.zhihu.com/p/33766210。 


军事 组 织 的 混成 化 、 单 官 化 和 局 平 化 


军队 之 所 以 分 为 不 同 的 兵种 ， 主 要 原因 古 武 右 的 使 用 和 场景 不 
同 ， 一 个 人 很 难 成 为 多 面 手 ， 分 工 有 利于 提高 掌握 该 武器 的 技能 。 但 
当 武 硕 目 身 越 来 越 目 动 化 和 目 主 化 时 ， 分 工 的 必要 性 束 降 低 了 ， 混 合 
使 用 武 絮 的 好 处 越 来 越 凸 显 。 所 以 今后 的 战争 可 能 不 再 是 陆军 和 陆军 
打 ， 空 军 和 空军 打 ， 海军 和 海军 打 ， 而 是 所 有 的 军种 一 起 打 。 军 种 之 
间 的 界限 会 越 来 越 模 糊 ， 甚 至 会 取消 现 有 的 军种 。 

由 于 未 来 战争 前 端 主要 是 目 动 化 和 目 主 化 武 右 在 拼搏 ， 所 以 需要 
的 血肉 之 驱 会 越 来 越 少 ， 一 个 人 可 以 协调 操控 大 批 目 主 化 武 融 。 作 为 
传统 的 作战 第 一 线 的 “士兵 "将 消失 ， 每 个 作战 人 员 都 是 一 个 指挥 员 ， 
所 以 未 来 的 趋势 不 是 “ 单 兵 化 ?而 是 “ 单 官 化 ”。 

军队 有 最 严格 的 层级 结构 。 传 统 军 事 对 个 人 依赖 很 小 ， 制 胜 的 保 
隐 是 一 个 巨大 团体 的 协调 行动 。 层 级 结构 能 保障 命令 和 信息 在 巨大 人 
群 中 最 快 地 传递 和 严格 地 执行 。 由 于 战斗 人 群 规模 的 缩小 和 个 体 ( 单 
官 ) 能 力 大 大 增加 ， 所 以 未 来 军队 将 像 今 天 的 高 科技 公司 一 样 越 来 越 
重视 个 体能 力 和 能 动 性 。 这 一 切 部 会 导致 末 来 的 军队 组 织 越 来 越 届 平 
化 。 


军事 组 织 从 以 武器 为 中 心 转向 以 数据 为 中 心 


军事 组 织 的 结构 取决 于 什么 样 的 结构 最 能 打 胜 会。 传统 军事 组 织 
围绕 武器 组 织 、 物 流 组 织 ， 新 军事 组 织 将 围绕 数据 组 织 。 未 来 战争 的 
前 端 主要 是 钢铁 机 右 ， 后 端 则 是 大 量 人 和 计算 能 力 负责 数据 收集 与 处 
理 。 由 于 数据 的 复杂 性 ， 组 织 将 划分 为 数据 收集 、 存 储 、 处 理 、 决 
策 。 每 一 种 武器 及 其 行动 轨迹 和 效果 ， 对 后 侣 军事 人 员 来 说 束 是 一 组 


数据 。 飞 机 和 舰 船 没 有 任何 区 别 。 未 来 的 后 勤 能 力主 要 是 对 机 需 的 能 
源 进 行 供给 和 补充 。 


战役 的 机 器 参 诬 部 


指挥 像 诺 曼 拘 登陆 这 样 的 大 型 战役 要 处 理 的 信息 无 穷 多 ， 同 时 要 
面 对 各 方面 的 不 确定 性 ， 即 使 一 个 天 才 军 事 指 挥 官 也 不 可 能 处 理 如 此 
巨 量 的 信息 ， 所 以 在 传统 战争 中 偶然 性 巨大 。 在 未 来 战争 中 ， 一 场 战 
役 已 经 在 计算 机 中 模拟 了 许多 损 。 变 量 越 多 ， 不 确定 性 越 强 ， 机 妖 学 
习 算 法 束 越 得 心 应 手 。 当 然 最 后 还 是 要 指挥 官 做 决定 ， 但 传统 的 参 误 
部 的 工作 许多 会 被 机 郝 取 代 。 正 如 机 大 能 户 得 了 围棋 世界 冠军 ， 谁 的 
机 器 参谋 部 算法 更 聪明 ， 谁 赢得 战争 的 机 会 就 大 。 

未 来 最 大 的 挑战 不 仅 是 谁 能 开发 出 最 先进 的 人 工 智 能 武 句 ， 也 有 是 
谁 能 通过 实战 数据 的 快速 类 代 训练 出 最 佳 模型 ， 更 是 谁 能 最 和 完 在 实战 
中 演化 出 最 佳 的 人 -机 混成 。 而 且 这 种 混成 比例 和 结构 会 随 着 机 妖 能 力 
的 提高 一 直 改 变 。 人 工 知 能 将 再 一 次 改变 战争 的 形态 ， 这 个 新 形态 不 
以 消灭 肉体 为 主 ， 而 是 以 机 喜之 间 的 搏斗 为 主 ， 这 对 人 类 来 说 越 来 越 
像 一 场 狂 热 的 足球 赛 。 和 体育 比赛 不 同 的 是 只 要 机 佐 人 败 了 ， 活 人 束 
禾 和 投降 。 


AI 武 厦 的 伦理 


目前 国际 法 对 人 工 智能 武 万 没有 任何 具体 规定 ， 国 际 社会 也 没有 
明确 文 持 限 制 或 树 止 此 类 武 右 系统 的 条 约 。 学 界 对 此 也 争议 不 断 ， 许 
多 重量 级 科学 家 反对 人 工 智能 武 右 化 。2015 年 ， 包 括 马 斯 元 和 和 霍金 在 
内 的 1 000 多 名 人 工 智能 专家 签 敬 了 一 封 公 开 信 ， 呼 吁 禁止 目 主 化 武 
郁 ， 他 们 甚至 称 完 全 人 工 智能 的 发 展 可 能 招致 人 类 历史 的 终结 。2018 


年 谷歌 公司 仅仅 因为 癌 美 国 军 方 的 一 个 项 目 Maven 提 供 了 TensorFlow 的 
接口 ， 就 有 近 4 000 名 谷歌 员工 联合 签名 请 愿 公司 不 要 和 和 军 方 合作 ， 
为 这 个 项 目的 目标 是 为 军 方 提供 先进 的 计算 机 视觉， 能 够 自动 检测 和 
识别 无 人 摄像 机 捕获 的 38 种 物体 ， 其 至 有 十 几 名 员工 因此 要 辞职 。 
际 机 器 人 武器 控制 委员 会 (ICRAC) 也 发 布 一 封 联名 公开 信 ， 超 过 300 
位 人 工 智能 、 伦 理学 和 计算 机 科学 的 学 者 公开 呼吁 谷歌 结束 该 项 目的 
工作 ， 并 支持 禁止 目 主 武器 系统 的 国际 条 约 。 


目 主 化 武器 很 可 能 加 剧 全 球 军备 范 赛 。2016 年 美国 国防 部 发 表 新 
报告 表示 ， 美 国 需要 “立即 采取 行动 ?加 速 AI 战争 科技 的 开发 工作 ,未 
来 AI 战争 不 可 和 避免， 建议 五 角 大 楼 在 这 方面 加 强 发 展 ， 否 则 会 被 潜在 
的 敌人 超越 。2017 年 7 月 ， 中 国 推出 了 《新 一 代 人 工 知 能 发 展 规划 》， 
该 规划 将 人 工 智能 指定 为 未 来 经 济 和 军事 力量 的 转型 技术 。 它 的 目标 
征 ， 到 2030 年 ， 中 国 将 利用 “军民 融合 ”战略 成 为 人 工 知 能 领域 的 结 越 
力量 。2017 年 9 月 ， 普 系 对 刚 开 学 的 俄罗斯 孩子 说 : “人 工 智 能 殉 是 未 
来 ， 不 仅 对 俄罗斯 而 言 ， 更 是 对 整个 的 人 类 社会 。 谁 成 为 这 个 领域 的 
领导 者 ， 谁 驶 将 成 为 世界 的 统治 者 。” 马 斯 克 在 推 竺 上 回应 道 : “在 国 
家 层面 上 人 工 智能 优势 的 竞争 是 最 可 能 导致 第 三 次 世界 大 战 的 原 
" ”这 种 军备 竞赛 可 能 会 使 国际 局 面 特别 不 稳定 ， 除 了 几 个 超级 大 
国 ， 其 他 国家 也 会 效仿 。 

人 工 智能 很 可 能 将 加 速 全 球 军事 力量 不 对 等 和 战争 的 发 生 。 拥 有 
人 工 智能 技术 、 战 搜 经 历 和 战争 数据 的 国家 能 够 让 目 主 化 武器 述 代 速 
度 更 快 。 目 前 ， 美 国 、 俄 罗斯 、 以 色 列 等 国家 拥有 较 多 战争 的 文字 、 
视频 记录 。 通 过 监控 休 怖 组 织 、 社 交 媒 体 、 其 他 国家 行动 的 数据 ， 并 
把 这 些 数据 喂 给 人 工 智能 让 它们 快速 升级 。 另 外 ， 目 主 化 武 郁 更 易 流 
通 和 被 滥用 ， 或 被 其 他 国家 和 念 饰 分 子 获 得 。 即 使 达成 了 禁止 军事 机 
咒 人 的 协议 ， 目 主 化 武器 技术 也 非常 易于 转让 ， 并 将 普及 开 来 。 男 
外 ， 因 为 该 类 武 絮 能 够 将 人 员 伤 亡 降 到 最 低 ， 所 以 政客 发 动 战争 的 阻 
碍 因素 又 减少 了 一 项 ， 毕 竟 美 国 等 地 民众 对 战争 造成 士兵 牺牲 的 抗议 
比 战争 花费 更 让 政府 头疼 。 


目 主 化 武 右 失控 和 错 判 的 风险 将 一 直 存 在 ， 比 如 软件 代码 错误 ， 
或 者 受到 网 络 攻击 。 这 可 能 导致 机 做 失灵 或 攻击 目 己 人 ， 或 由 于 系统 
升级 太 快 ， 人 类 伙伴 无 法 及 时 啊 应 。 很 难 对 目 动 化 武 右 的 可 靠 性 进行 
测试 ， 会 思 寺 的 机 器 的 行事 方式 也 可 能 会 超出 人 类 控制 者 的 想象 。 无 
论 是 在 人 机 交互 的 回路 之 内 〈《 人 类 不 间断 监控 操作 ， 并 保有 关键 决策 
的 负责 人 ) ， 还 是 在 回路 之 上 (人 类 监督 机 器 ， 并 可 以 在 任务 的 任何 
阶段 干预 机 器 ) 或 者 跳出 回路 (机 器 执行 任务 时 没有 人 员 干 预 ，， 人 人 
们 应 该 如 何 与 不 同 程度 的 目 主 机 器 交互 仍然 有 生 妍 究 。 西 方 军事 机 构 
坚持 认为 ， 人 类 必须 始终 处 于 人 机 交互 的 回路 之 中 。 但 是 看 到 了 完全 
目 主 系统 所 市 来 的 军事 优势 ， 不 十 每 个 国家 都 会 这 么 审慎 。 


群体 学 习 和 光速 分 享 


一 个 很 有 意思 的 例子 是 谷歌 关于 机 械 手 学 习 的 实验 。 如 图 6.12 所 
示 ， 在 盘子 里 放 一 些 各 种 形状 的 物体 ， 预 先 没 有 任何 编程 指令 ， 让 机 
械 手 通过 上 方 的 摄像 头 自己 摸索 着 把 每 个 物体 从 盘子 里 拿 出 来 。 可 以 
想象 ， 这 个 学 习 过 程 需 要 很 长 时 间 ， 因 为 一 开始 机 械 手 在 空中 乱 抓 ， 
直到 蒙 对 了 一 个 的 时 候 它 才能 找 对 地 方 ， 然 后 又 要 学 会 抓 取 不 同形 状 
的 物体 。 更 复杂 的 是 一 个 物体 紧 挨 着 另 一 个 物体 ， 机 械 手 必须 学 会 先 
把 边 上 的 物体 挪 开 。 这 台 机 器 学 习 大 约 需 要 80 万 次 的 摸索 ， 如 果 每 10 
秒 抓 取 一 次 ， 那 么 一 台 机 器 要 24 小 时 不 停 地 学 习 100 天 。 


单 目 彩色 摄像 头 


7 和 目 由 度 机 械 手 


图 6.12 机 械 手 学 习 从 盘子 中 抓 取 不 同 的 物体 


图 片 来 源 : https://spectrum.ieee.org/automaton/robotics/artificial-intelligence/google-largescale- 
robotic-grasping-project ° 


但 当 合 歌 让 14 台 机 此 一 起 学 习 的 时 候 ， 学 习 的 时 间 就 缩短 到 了 
100/14=7 天 。 这 14 台 机 絮 都 互相 联网 ， 当 一 台 机 妖 找 对 地 方 或 学 会 
一 个 技能 时 ， 其 他 所 有 的 机 器 瞬间 都 学 会 了 。 这 种 机 右 之 间 的 交流 不 
仅 是 无 障碍 的 而 且 是 以 光速 进行 的 。 (如 图 6.13) 


图 6.13 谷 歌 的 14 台 互相 联网 的 机 械 手 同时 学 习 抓 取 物 体 


图 片 来 源 : https://spectrum.ieee.org/automaton/robotics/artificial-intelligence/google-largescale- 


robotic-grasping-project ° 


人 类 的 知识 传播 阻力 重重 ， 有 成 本 问题 ， 有 利益 问题 ， 还 有 学 习 
者 的 接受 能 力 问 题 。 未 来 机 器 之 间 的 群体 学 习 、 无 私 共 译 和 光速 传播 
一 定 会 珊 来 不 可 思议 的 奇迹 。 我 们 今天 可 以 想象 的 奇迹 有 以 下 几 方 
面 。 


(1) 机 器 可 以 在 极 短 的 时 间 内 掌握 极 难 的 技能 。 例 如 轰 驶 飞机 通 
党 需要 几 百 小 时 的 飞行 训练 ， 战 斗 机 需要 更 长 的 时 间 ， 如 果 古 1 万 个 机 
0 起 学 习 ， 可 能 一 秒 束 能 达到 王牌 飞行 员 的 水 


站 


(2) 数 年 内 让 几 千 万 人 失业 。 目 前 硅谷 Vicarious 公 司 在 开发 机 械 
可 以 安装 在 任何 类 型 的 机 械 手 上 来 取代 目前 各 种 加 
工 、 筛 选 、 检 测 、 物 流 中 的 人 力 。 一 旦 这 种 类 型 的 软件 成 熟 ， 取 代 人 
ii 轮 加 上 几 个 蕊 片 。 


(3) 超级 规模 的 协同 行动 。 协 调 人 类 的 大 规模 行动 很 难 ， 例 如 让 
分 布 在 世界 各 个 国家 的 100 万 人 在 同一 个 时 间 唱 同一 首 歌 吏 是 一 个 几乎 
无 法 完成 的 任务 ， 但 是 让 100 万 台 机 器 同时 跳 一 文 舞 却 很 容易 。 人 类 最 
大 规模 的 协同 行动 通常 是 战争 ， 未 来 的 战争 可 能 是 天 空中 突然 出 现 几 
万 架 无 人 机 ， 战 斗 在 几 秒 内 结束 。 

(4) 通用 机 器 人 智力 增长 惊人 。 如 果 未 来 能 够 有 通用 机 器 人 ， 让 
散布 在 世界 各 地 的 从 事 各 种 工作 的 机 絮 人 的 大 脑 相互 联结 ， 你 束 会 惊 
奇 地 发 现 它 们 每 分 钟 都 在 学 会 新 的 东西 。 从 痢 生 儿 到 成 人 的 几 十 年 的 
学 习 会 压缩 到 几 分 钟 其 至 几 秒 。 一 台新 机 器 人 刚 接 通电 源 整 会 变 成 读 
过 万 着 书 、 行 过 万 里 路 的 “ 老 江 调 ”。 


人 类 哪里 比 机 器 强 


看 完 上 面 的 讨论 读者 可 能 非常 部 闷 ， 难 道 我 们 人 类 束 没 有 比 机 套 
强 的 地 方 了 吗 ? 撒 开 情感 ， 如 果 只 讨论 智力 和 智能 ， 人 比 机 器 强 在 哪 
里 ? 这 个 问题 要 分 成 两 个 部 分 来 谈 ， 一 是 目前 人 比 机 右 强 在 哪里 ? 二 
是 人 可 能 永远 比 机 妖 强 在 哪里 ? 

和 目前 的 神经 网 络 相 比 ， 人 类 在 认 知 方面 比 机 器 强 在 以 下 几 个 方 
面 。 


(1) 学 习 识别 物体 不 需要 大 数据 。 机 器 要 认识 一 只 猫 也 许 要 几 万 
张 图 片 ， 图 片 的 颜色 或 构图 稍微 变化 一 下 或 者 有 人 遮挡、 残缺 ， 机 器 就 
不 行 了 。 而 人 类 能 够 从 小 数据 中 迅速 提炼 归纳 出 规律 ， 一 个 婴儿 可 以 
看 见 一 只 猫 后 就 认识 了 所 有 的 猫 。 也 许 正如 莫 桑 维 克 悖 论 所 盖 壕 的 ， 
高 级 推理 所 需要 的 计算 量 不 大 ， 反 倒是 低级 的 感觉 运动 技能 需要 庞大 
的 计算 资源 。 


(2) 机 器 没有 常识 和 物理 世界 的 模型 。 人 类 在 一 个 陌生 环境 摸索 
一 阵 后 ， 能 很 快 在 大 脑 中 建立 起 模型 来 。 
(3) 机 器 没有 自主 和 自发 的 通用 语言 能 力 (目前 人 类 输入 的 语法 
规则 或 通过 数据 训练 出 来 的 “语言 ”能力 只 能 处 理 限定 场景 ， 否 则 整 能 
通过 图 灵 测 试 了 ) 。 
(4) 机 器 没有 想象 力 (需要 大 量 常识 ， 反 事实 假设 及 推理 能 
te 
(5) 机 器 没有 目 我 意识 。 
(6) 机 器 没有 情感 和 同 理 心 。 
总 体 来 说 ， 基 于 神经 网 络 的 机 需 学 习 的 主要 功能 是 记忆 和 识别 ， 
其 他 一 切 能 力 都 是 建立 在 这 个 基础 上 的 。 基 于 神经 网 络 的 机 赤 大 脑 更 
像 一 个 低 等 动物 的 大 脑 ， 只 具有 对 外 界 的 反应 能 力 ， 虽 然 这 种 反应 能 
力 的 精密 和 复杂 程度 远 超 人 类 和 其 他 动物 。 
如 果 未 来 人 工 智能 的 基础 还 是 神经 网 络 ， 随 着 训练 数据 集 的 增 大 
和 人 处理 能 力 的 增强 ， 上 面 的 (1) 就 会 得 到 改善 甚至 可 以 达到 人 类 的 水 
平 。 其 中 (2) 也 有 可 能 用 穷尽 法 解决 。 但 是 很 难 想象 机 器 会 具有 通用 
语言 能 力 、 想 象 力 ， 更 谈 不 上 目 我 意识 。 
简单 地 说 ， 虽 然 基于 神经 网 络 的 人 工 智能 在 记忆 和 识别 这 两 个 基 
础 智能 方面 超过 了 人 ， 但 在 推理 、 想 象 等 高 级 智能 方面 还 和 人 相去 其 
远 。 未 来 最 佳 的 结合 束 是 人 类 和 机 器 合作 ， 互 相 取 长 补 短 。 


人 机 融合 


人 类 和 机 器 该 如 何 合 作 ? 脑 机 接口 (BMI: brain-computer 
interface) 是 科学 家 研究 的 一 个 重要 方向 ， 指 创建 在 人 类 或 动物 大 脑 与 


外 部 设备 之 间 的 直接 连接 通路 。 被 脑 机 接口 串联 的 人 脑 能 够 与 外 部 设 
备 之 间 互 相传 送信 号， 交换 信息 。 可 以 预料 ， 当 这 项 技术 发 展 到 一 定 
的 程度 ， 人 们 或 能 够 通过 “外 挂 ? 外 部 设备 的 方式 ， 来 提高 生物 体 脑 部 
的 感知 、 运 算 等 能 力 ， 以 及 通过 脑 电 波 更 为 直接 地 对 外 部 机 絮 下 达 命 
令 ， 或 与 其 他 人 类 进行 协同 。 

最 激进 的 方法 之 一 束 是 马 斯 克 提 出 的 Neuralink， 研 发 出 一 种 “神经 
蔓 丝 对接 在 人 脑 的 神经 网 络 上 ， 直 接 接 收 人 脑 的 信号 。 马 斯 克 认 为 机 
事 “ 思 维 ? 和 输入 输出 都 非常 快 ， 而 人 类 通过 语言 或 键盘 的 输入 输出 比 
机 器 慢 好 几 个 数量 级 ， 这 将 是 人 类 和 机 器 相 比 最 大 的 务 势 。 不 打破 这 
个 瓶颈 ， 人 类 总 有 一 天 会 受制 于 机 器 。Neuralink 要 解决 的 是 突破 人 类 
的 信号 输入 和 输出 瓶颈 ， 但 他 的 想法 有 一 个 基本 漏洞 ， 人 类 的 高 级 思 
维 必 须 依赖 语言 。 如 果 脱 离 了 语言 我 们 就 完全 无 法 进行 高 级 思维 (如 
逻辑 推理 、 描 述 场景 等 ) 。 如 前 所 述 ， 目 前 的 基于 神经 网 络 的 机 器 学 
习 能 力主 要 是 对 环境 的 识别 能 力 ， 还 没有 升华 到 语言 和 逻辑 推理 。 而 
人 类 只 能 通过 语言 进行 沟通 。 这 也 是 我 们 在 前 文 所 说 的 ， 人 类 的 “明知 
识 ” 无 法 和 机 怖 的 “ 暗 知识 ”沟通 。 

在 硅谷 ， 另 一 位 成 功 的 企业 家 布 莱 恩 :约翰逊 (Bryan Johnson) 也 
成 立 了 一 家 公司 叫 Kermel， 宣 称 要 能 够 对 神经 网 络 的 底层 功能 直接 读 
和 写 ， 他 号 称 要 投入 一 亿美 元 来 打造 这 个 技术 。Kernel 和 Neuralink 当 
前 的 主要 目的 是 让 这 些 机 器 和 人 脑 一 起 工作 ， 当 这 些 设备 用 于 治疗 脑 
部 疾病 时 ， 设 备 不 光 辐 大 脑 发 送信 号 以 便 作 为 治疗 的 手段 ， 也 会 收集 
这 些 病 证 的 特征 数据 。 正 如 约翰 示 所 说 的 ， 这 些 设 备 可 以 采集 到 关于 
人 脑 工作 原理 的 大 量 数据 ， 从 而 反哺 所 有 神经 科学 的 研究 领域 。 约 翰 
示 认 为 ， 如 采 我 们 拥有 来 目 大 脑 更 多 区 域 、 更 高 质量 的 神经 数据 ， 那 
么 它 能 为 神经 科学 的 研究 这 来 更 多 可 能 性 ， 只 是 我 们 目前 还 没有 合适 
的 工具 去 获知 这 些 数据 。 但 Kernel 公 司 的 技术 顾问 ， 斯 坦 福 大 学 神经 
科学 家 大 卫 . 伊 格 曼 (David Eagleman) 教授 认为 在 一 个 健康 人 的 脑 中 
动手 术 植 入 一 个 电脑 接口 根本 不 可 能 。 先 不 说 死亡 、 感 染 、 人 免疫 排 不 
等 危险 ， 连 往 哪 接 目前 都 不 知道 。 脑 神经 科 的 医生 动 开 颅 手术 和 脑 神 


经 手术 都 是 在 万 不 得 已 的 情况 下 ， 例 如 患者 的 大 脑 有 闫 重 疾病 或 损 
伤 。 伊 格 曼 认为 更 有 可 能 的 情况 是 ， 科 学 家 会 发 现 更 好 的 从 外 部 读 取 
和 模拟 大 脑 的 方法 。 今 天 ， 医 生 通 过 功能 性 核磁 共振 成 像 仪 (FMRI) 
等 技术 读 取 大 脑 的 信息 ， 并 通过 经 颅 磁 刺激 等 方法 改变 其 行为 ， 但 这 
些 仍 然 是 较为 简单 的 技术 。 伊 格 受 认为 ， 如 果 科 学 家 能 够 对 人 脑 有 更 
好 的 了 解 ， 那 么 他 们 可 以 大 幅 改 进 这 些 方法 ， 或 基于 它们 而 发 明 更 有 
用 的 方法 。 例 如 ， 科 学 家 可 以 通过 基因 技术 去 改变 神经 元 ， 从 而 使 机 
绥 可 以 从 体外 对 神经 元 进行 “ 读 写 "， 或 者 也 可 以 通过 “和 服 ?纳米 机 需 
人 实现 同样 的 目的 ， 所 有 这 些 方 法 都 比 植 入 神经 网 络 靠 谱 。 


其 实 马 斯 元 并 非 第 一 个 提出 这 个 设想 的 人 ， 这 方面 的 研究 历史 至 
少 有 100 年 之 久 ， 商 业 化 的 努力 也 一 直 前 赴 后 继 。 外 科 医 生 已 经 能 够 把 
某 些 设备 移植 到 人 体内 ， 脑 神经 科 的 手术 目前 主要 是 植 入 深度 神经 刺 
激 信 号 ， 用 来 治疗 癫痫 、 由 金森 病 等 ， 重 建 患者 的 视觉 、 运 动 等 能 
力 。 例 如 通过 植 入 电极 来 抑制 疾病 发 病 时 的 神经 脑 电信 号 ， 在 这 些 情 
况 下 ， 冒 一 些 风 险 是 值得 的 。IBM 的 科学 家 在 开发 一 个 类 似 的 项 目 ， 
通过 分 析 在 烽 病 发 作 时 的 大 脑 信号 ， 做 出 可 植 入 人 体 并 能 抑制 癫痫 发 
作 的 仪器 。 ( 见 图 6.14) 


图 6.14 用 于 治疗 壮 病 的 RNS 系 统 装备 

图 片 来 源 : IBM Treat epilepsy with RNS。 

目前 主要 的 成 功 案 例 来 和 目 一 名 叫 作 威 廉 姆 :多 贝尔 (William 
Dobelle) 的 科学 家 。1978 年 ， 多 贝尔 在 一 位 言 人 的 脑 内 植 入 了 由 68 个 
电极 组 成 的 阵列 ， 这 种 尝试 使 盲人 产生 了 光 幻 视 (视网膜 受到 刺激 时 
产生 的 感觉 ) 。 在 随后 的 调试 中 ， 接 受 这 种 治疗 的 言 人 能 够 在 有 限 的 
视野 内 看 到 低 分 辨 率 、 低 刷新 率 的 点 阵 图 像 。2002 年 ， 接 受 新 一 代 系 
统治 疗 的 患者 恢复 了 更 多 的 视力 ， 甚 至 可 以 在 研究 中 心 附 近 驾 车 慢 速 
前 行 。 同 一 阶段 ， 在 恢复 运动 功能 方面 ， 脑 机 接口 研究 也 取得 了 显著 
的 进展 。 ( 见 图 6.15) 


图 6.15 双 目 失 明 的 延 斯 在 仿生 眼 的 帮助 下 得 到 了 一 定 程度 的 视力 


片 来 源 : jensnaumann.green-fi rst.com 。 


刚才 提 到 除了 植 入 电极 还 有 一 种 可 能 的 方法 是 在 头 上 戴 一 个 “电极 
量 ”， 采 用 “黑箱 "方法 解读 人 脑 。 只 要 党 在 头 上 的 电极 置 能 够 从 大 脑 中 
稳定 地 检测 到 足够 复杂 的 信号 ， 用 此 时 人 的 语言 或 动作 作为 输出 ， 通 
过 机 器 学 习 的 方法 建立 输入 〈 检 测 到 的 脑 电信 号 ) 和 输出 (语言 或 动 
作 ) 的 一 一 对 应 。 这 里 的 假设 是 对 应 每 一 个 输出 的 输入 都 是 相同 或 类 
似 (例如 每 次 竖 大 拇指 的 脑 电 波 都 相同 ) 的 且 能 稳定 地 检测 这 些 信 
号 。 这 种 方式 没有 在 大 脑 内 植 入 电极 ， 信 号 没有 那么 清晰 ， 数 据 量 没 
有 那么 大 ， 也 没有 那么 稳定 ， 受 到 的 干扰 也 会 更 强 一 些 。 

虽然 通过 头 戴 式 装 备 获取 微弱 的 脑 电 波 信和 号 的 方式 难度 很 大 ， 但 
是 经 过 几 十 年 的 发 展 ， 科 学 家 已 经 开始 取得 突破 ， 尤 其 是 在 残疾 人 部 
分 能 力 的 重建 上 。1988 年 ， 美 国 科学 家 已 经 实现 了 用 大 脑 控 制 虚拟 打 
字 机 的 操作 ， 瑞 典 科 学 家 更 是 实现 了 轮椅 按 人 脑 意 识 控制 前 进 。2006 
年 ， 日 本 研制 出 “混合 辅助 腿 ”， 能 够 帮助 残疾 人 以 每 小 时 4 千 米 的 速度 
行走 。 在 2014 年 世界 杯 上 ， 刁 官 截 次 的 巴西 青年 朱 利 亚 详 : 平 托 号 穿 一 
套 奇 怪 的 “机 械 战 甲 ”， 在 工作 人 员 的 帮助 下 开 出 了 世界 杯 的 第 一 肢 
球 ， 这 背后 束 是 使 用 脑 机 接口 技术 + 外 骨骼 成 功 让 一 个 瘫痪 患者 恢复 
了 行动 能 力 。 ( 见 图 6.16) 

另外， 该 类 技术 已 经 能 够 实现 远程 控制 机 器 、 玩 游戏 等 。2008 年 1 
月 ， 杜 元 大 学 的 研究 团队 让 和 里 在 美国 达 勒 姆 实验 室 的 猴子 用 意识 控制 
了 远 在 日 本 京都 实验 室内 机 器 人 的 行走 。2013 年 3 月 ， 英 国 研 究 人 员 开 
发 出 第 一 种 用 于 控制 飞船 模拟 需 的 “ 脑 机 接口 ?装置 ， 美 国 科 学 家 又 创 
建 了 计算 机 模拟 程序 ， 戴 在 头 上 后 通过 人 脑 的 意念 便 可 以 控制 飞船 模 
拟 飞 行 。2017 年 10 月 ， 美 国 亚利桑那 州立 大 学 以 人 为 导 癌 机 器 人 和 控 
制 实验 室 的 负责 人 Panagiotis Artemiadis 宣 布 正在 研发 一 种 导航 系统 ， 
能 够 让 萄 驶 员 只 借助 自己 的 思维 同时 操控 一 群 无 人 机 。 


图 6.16 为 巴西 世界 杯 开 球 的 志愿 者 朱 利 亚 诺 - 平 托 


片 来 源 : http://hiphotos.baidu.com/feed/pic/item/f603918fa0ec08fab12d60f453ee3d6d55f 
bdab0.jpg。 


脑 机 接口 技术 的 意义 在 于 能 够 让 人 的 大 脑 能 力 获得 提升 ， 或 实现 
能 力 重 建 ， 甚 至 是 实现 远程 控制 。 本 质 上 普通 人 只 能 用 目 己 的 意识 来 
控制 目 己 的 身体 ， 而 脑 机 技术 能 够 让 人 类 实现 通过 意识 操 探 远 在 千里 
之 外 的 机 器 人 ， 更 重要 的 是 ， 通 过 机 器 人 〈 胶 体 ) 的 传感器 ， 这 些 感 
觉 可 以 实时 传 回 到 人 类 的 大 脑 一 一 在 菜 种 程度 上 人 类 已 经 实现 了 肉体 
的 无 限 延 伸 和 空间 的 罕 越 ， 这 已 经 二 窗 了 人 类 的 认 知 。 脑 机 接口 的 远 
程控 制 月 在 诸多 领域 实现 应 用 ， 例 如 乔 慧 机 右 人 去 危险 的 火灾 、 电 
力 、 搜 救 等 领域 工作 ， 同 样 也 可 以 在 地 质 勘 探 、 农 业 、 物 流 等 领域 实 
现 应 用 。 


通过 连接 到 云 闹 提升 语言 能 力 


谷歌 技术 总 监 库 效 韦 尔 (Kurzweil) 认为 ， 由 于 智能 手机 能 提供 
海量 的 计算 和 数据 ， 所 以 它 已 经 让 我 们 远 远 比 20 年 前 的 人 聪明 。 有 朝 
一 日 ， 我 们 不 再 需要 手持 设备 ， 通 过 植 入 大 脑 皮 质 的 心 片 惑 可 以 让 我 
们 连接 到 云端 。 我 们 可 以 通过 与 人 工 智 能 结合 而 变 得 更 加 智能 ， 通 过 
更 多 潜在 的 方式 去 共享 语言 (例如 能 立刻 接 入 英语 词典 ) 。 库 兹 韦 尔 
认为 这 些 和 我 们 现在 的 习惯 差别 不 大 ， 只 是 用 大 脑 中 的 芯片 奉 代 了 翻 


x 


译 。 
浊 考 “不 吏 ” 


通过 给 人 工 智能 系统 灌输 某 个 人 的 照片 、 视 频 、 音 频 、 信 件 、 日 
记 、 邮 件 、 账 单 以 及 任何 能 表现 他 个 性 的 东西 ， 可 以 造 出 逝 者 的 “化 
身 ”， 我 们 戴 上 头 亚 束 可 以 在 虚拟 世界 和 他 交流 互动 。 库 效 韦 尔 表示 他 
已 经 造 出 了 他 过 世 多 年 的 父亲 的 “化 身 ?”， 他 认为 这 是 一 个 将 父亲 再 回 
亲人 身边 的 方式 ， 虽然 目前 把 打者 市 回 人 工 智 能 世界 还 不 完全 真实 ， 
但 以 后 会 更 加 接近 。 


第 七 章 


“ 神 人 ?与 “ 利 人 :一 一 AI 时 代 的 社会 与 伦理 


AI 珊 来 的 变化 绝 不 只 是 在 商业 和 科技 领域 ， 而 是 和 互联 网 一 


样 会 冲击 今天 的 社会 结构 甚至 道德 伦理 ， 每 一 个 在 社会 中 生活 的 
人 部 会 受到 影响。 即使 没有 读 前 面 的 草 记 ， 也 可 以 直接 读 这 一 
音 。 


AI 机 亏 的 崛起 会 不 会 导致 大 规模 失业 ? 运 今 为 止 , 历史 上 大 的 技 
术 突 破 并 没有 对 人 类 的 工作 产生 毁灭 性 的 打击 。 共 汽 机 的 诞生 替代 了 
传统 的 又 马 ， 印 刷机 的 诞生 取代 了 传统 的 抄写 员 ， 农 业 目 动 化 设施 的 
产生 替代 了 很 多 农民 的 工作 ， 但 这 都 没有 致使 大 量 的 人 人 流离失所 。 相 
反 ， 人 们 找到 了 更 适合 人 类 的 工作 。 

但 这 次 还 会 一 样 吗 ? 随 着 智能 机 吉 的 崛起 ， 大 量 重 复 性 玫 动 将 被 
替代 。 在 这 个 社会 中 ， 人 类 能 够 在 技术 帮助 下 做 更 多 的 事情 ， 从 而 更 
多 人 负责 创造 新 事物 。 但 如 何 保证 原 有 重复 性 劳动 者 能 够 稳步 过 渡 到 新 
工作 ， 将 成 为 一 项 挑 成 ， 毕 竟 这 次 变 单 的 冲击 将 超过 历史 上 的 任何 一 
次 变 早 。 各 国政 府 都 在 未 雨 绸 引 应 对 可 能 会 出 现 的 贫 主 分 化 加 速 。 


《未 来 简 史 》 一 书 的 作者 尤 瓦 尔 : 赫 拉 利 (Yuval Harari) 曾 预测 ， 
各 二 年 后 ， 人 类 社会 最 大 的 问题 是 人 工 知 能 带 来 一 大 批 “无 用 的 人 


类 ”， 同 时 ， 也 会 催生 出 “超人 类 ” (Superhuman) 。 他 认为 ， 一 小 部 分 
超人 类 将 可 以 借助 科学 技术 不 断 地 “更 新 ”自身 ， 操 探 基 因 ， 甚 至 实现 
人 脑 与 计算 机 互联 ， 获 得 一 种 不 死 的 状态 。“ 在 以 前 的 历史 上 ， 贫 富 差 
距 只 是 体现 在 财富 和 权力 上 ， 而 不 是 生物 学 上 上， 帝王 和 农民 的 吴 体 构 
造 是 一 样 的 。 在 人 可 以 变 成 超人 类 后 ， 传 统 的 人 性 就 不 存在 了 ， 人 类 
会 分 化 为 在 体能 和 智能 上 都 占据 绝对 优势 的 超人 阶层 和 成 千 上 万 普通 
的 无 用 的 人 类 。” 他 的 担心 会 成 为 现实 吗 ? 

机 器 酿 成 的 事故 由 谁 负 责 ? 目 主 化 武器 、 无 人 区 驶 汽车 、 生 产 机 
需 人 等 都 可 能 因为 代码 错误 或 在 环境 巨变 下 失控 醒 成 灾难 。 随 痢 智 能 
产品 的 逐渐 普及 ， 我 们 对 它们 的 依赖 也 越 来 越 深 。 当 机 器 遇 到 困难 
时 ， 往 往 会 将 操控 权 转 交 给 人 类 ， 而 人 类 很 难 瞬 间接 管 好 一 项 突然 转 
来 的 工作 。 比 如 人 类 接管 无 人 车 要 驶 时 可 能 因为 睡 肴 了 或 注意 力 不 集 
中 而 发 生 事故 ， 这 种 事故 在 人 类 和 机 器 之 间 也 很 难 厘 清 责任 。 


在 未 来 的 战争 中 ， 军 方 为 了 减少 己方 伤亡 将 尽 可 能 用 自主 化 武器 
代替 人 进行 军事 活动 。 自 主 化 武器 将 让 后 台 操纵 人 员 不 用 对 每 个 具体 
结果 负责 任 。 而 且 随 着 自主 化 武器 任务 的 日 益 复 杂 ， 后 台 操纵 人 员 也 
越 来 越 多 ， 每 个 人 只 是 完成 一 个 任务 的 一 小 部 分 。 这 使 人 们 对 这 种 " 杀 
发 " 变 得 心安 理 得 。 


谁 先 失 业 


牛津 大 学 的 一 份 研究 报告 指出 下 列 职业 将 是 最 先 被 人 工 智 能 取代 
的 ， 在 2033 年 下 列 职业 被 AI 取代 的 概率 如 下 : 

(1) 电话 营销 员 ，99% 。 

(2) 收银 员 ，97% 。 

(3) 快餐 厨师 ，969% 。 


(4) 律师 助手 ，94%。 

(5) 导游 ，91%。 

(6) 公交 车 和 出 租车 司机 ，89% 。 
(7) 安保 人 员 ，84%。 

(8) 档案 管理 员 ，76% 。 


将 被 AI 取代 的 工作 和 职业 远 不 止 这些 。 麦 肯 锡 发 表 的 一 份 研 究 报 
告 指出 ， 中 国 的 劳动 力 可 以 补 目 动 化 的 程度 比 世 界 上 任何 其 他 国家 都 
要 高 。 据 该 报告 估计 ，20 年 内 中 国 51% 的 工作 可 以 自动化， 相当 于 
3.94 亿 全 职员 工 。 最 容易 被 AI 取代 的 是 那些 重复 性 高 、 可 了 预测、 可 编 
程 的 工作 。19 世 纪 的 机 喜 主 要 代替 体力 工作 者 ， 这 次 AI 将 替代 许多 脑 
力 工作 者 。 中 等 技能 的 专业 人 员 可 能 首当其冲 ， 而 目前 很 难 程序 化 的 
工作 ， 例 如 保姆 反而 很 难 锐 取代。 许多 高 技能 、 高 收入 的 职业 也 可 能 
受到 冲击 。 这 种 冲击 体现 在 两 个 方面 : 一 是 直接 取代 ， 例 如 中 级 X 光 
读 片 医生 和 律师 事务 所 的 文书 ， 二 是 增强 ， 例 如 医生 的 AI 辅助 诊断 。 
许多 任务 可 能 会 目 动 化 或 大 大 缩短 时 间 ， 有 些 工 作 可 能 会 发 生 改 变 。 
正如 电脑 出 现 后 并 没有 请 灭 会 计 ， 而 是 让 会 计 更 高 效 ， 能 分 析 过 去 无 
法 分 析 的 大 量 数据 ， 能 产生 过 去 无 法 产生 的 大 量 图 形 和 表格 。AI 对 许 
多 行业 的 影响 也 将 类 似 。 

同样 的 道理 ， 那 些 很 难 标 准 化 、 程 序 化 的 工作 将 是 最 难 被 AI 取 代 
的 。 以 下 是 一 部 分 最 难 被 取代 的 工作 ， 它 们 未 来 被 取代 的 概率 如 下 : 


1) 考古 学 家 ，0.07%。 

心理 咨询 和 毒 着 治疗 工作 者 ，0.3%。 
职业 病理 疗 师 ，0.35%。 

草 养 师 ，0.39% 。 

医生 特别 是 外 科 手 术 医 生 ，0.429%。 
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(2) 
(3) 
(4) 
(5) 
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(6) 神职 人 员 ，0.81%。 


这 些 难以 被 AI 取 代 的 职业 的 一 个 特点 是 需要 有 对 人 类 情感 和 精神 
的 理解 。 这 是 目前 的 AI 完 全 无 法 做 到 的 。 


孩子 该 学 什么 


目前 AI 工作 市 场 很 热 ， 各 公司 竞相 出 高 薪 吸 引 AI 人 才 ， 特 别 是 高 
级 人 才 。 各 类 嫉 训 班 也 趁机 大 发 其 财 ， 许 多 大 学 生 、 研 究 生 纷纷 选修 
AI 的 课程 。 随 着 进入 这 个 领域 的 人 数 增 加 和 AI 计算 能 力 越 来 越 “程序 
化 >， 预 计 不 出 五 年 普通 的 AI 人 才 就 会 产生 剩余 。 每 当 朋 友 问 到 “我 的 
孩子 要 学 AI 吗 ”， 笔 者 的 回答 都 是 "学 好 数理 化 ， 走 遇 天 下 都 不 代 ”。 现 
代 科 学 的 全 部 基础 是 2 500 年 前 希腊 的 《几何 原本 》“。 但 凡 称 得 上 科学 
的 学 科 一 定 具备 两 个 特点 : 一 是 具备 像 《 几 何 原 本 》 那 样 的 公理 系 
统 ; 二 是 可 以 用 实验 验证 假设 。 物 理学 是 建立 在 数学 之 上 的 ， 化 学 又 
是 建立 在 物理 学 之 上 的 ， 生 物 学 又 是 建立 在 物理 和 化 学 之 上 的 。 归 根 
结 底 ， 所 有 现代 科学 的 基础 都 是 数学 。 人工 智 能 也 不 例外 ， 基 于 神经 
网 络 的 机 器 学 习 的 全 部 数学 基础 就 是 偏 微 分 方程 和 线性 代数 (两 门 大 
学 理工 科 的 必修 课 ) ， 人 工 智能 其 他 流派 可 能 还 要 涉及 概率 论 (大 学 
基础 课 ) 和 随机 过 程 《大 学 或 研究 生 课 程 ) 。 今 天 的 小 学 生 、 中 学 生 
到 大 学 毕业 时 ， 人 工 智 能 不 知 会 发 展 到 什么 程度 ， 但 它 的 数学 基础 还 
将 是 以 上 这 些 课程 。 一 二 十 年 以 后 ， 也 许 基 于 神经 网 络 的 机 器 学 习 会 
过 到 瓶 贷 ， 但 学 好 数理 化 的 孩子 可 以 有 许多 其 他 选择 ， 而 不 必 局 限 在 
ATI 领域。 

除了 数学 ， 另 外 一 门 最 重要 的 课 就 是 语文 (包括 外 语 ) 。 语 文 培 
养 的 不 仅 是 表达 能 力 ， 更 重要 的 是 培养 同 理 心 的 途径 。 人 类 之 间 沟 通 
的 基础 就 是 同 理 心 和 共 情 心 ， 即 根据 自己 的 感觉 理解 别人 的 能 力 。 机 


器 没有 同 理 心 和 共 情 心 ， 未 来 最 难 被 机 器 取代 的 就 是 需要 和 人 类 沟通 
的 工作 。 

在 能 力 方面 ， 除 了 沟通 能 力 以 外 ， 未 来 最 重要 的 是 想象 力 和 创造 
力 ， 而 不 是 “工匠 ”能 


AI 时 代 的 新 工种 


新 蓝领 工种 


像 以 往 的 新 技术 一 样 ，AI 将 催生 一 系列 新 的 职业 。 以 下 是 可 以 预 
见 的 新 蓝领 工种 。 


1. 数 据 标 注 员 


在 AI 视觉 的 发 展 史上 ，ImageNet 的 庞大 数据 库 发 挥 了 重要 的 作 
用 。 这 个 数据 库 中 有 上 和 于 万 张 用 人 工 标注 了 的 图 像 〈 例 如 一 张 狗 的 照 
片上 标注 “德国 牧羊 犬 ") ，ImageNet 的 创建 者 斯 坦 福 大 学 的 李 飞 飞 教 
授 在 网 络 上 动员 了 上 万 人 参与 到 标注 工作 中 来 。 目 前 许多 AI 算法 的 训 
练 都 有 赖 于 大 量 的 已 标注 数据 。 许 多 大 公司 例如 谷歌 已 经 开始 雇用 越 
来 越 多 的 人 标注 数据 ， 包 括 图 像 、 视 频 等 。 这 个 工作 需要 多 少 人 呢 ? 
原则 上 讲 要 把 被 识别 的 种 类 的 所 有 情况 都 标注 出 来 ， 机 亏 才 能 “全 面 党 
握 *。 例 如 在 目 动 芝 驶 中 所 有 需要 判断 的 场景 都 需要 标注 出 来 ， 而 这 些 
场景 可 能 无 穷 多 。 


2. 数 据 采 集 师 


目 动 芝 驶 要 采 集 一 个 国家 所 有 道路 的 精确 地 图 ， 需 要 几 百 辆 数据 
采集 车 党 年 采集 。 我 们 的 生产 和 生活 中 有 无 数 这 样 需要 采集 数据 的 工 
作 。 除 了 在 田野 采集 数据 ， 许 多 数据 还 需要 后 台 的 清理 ， 这 些 也 少 不 
站 信 工 的 干预 


3.AI 吕 经 师 


许多 AI 算法 在 正确 识别 场景 之 后 并 不 知道 该 如 何 行动 ， 这 时 人 类 
可 以 提供 指导 。 例 如 可 以 在 汽车 区 驶 模拟 右上 随机 产生 千变万化 的 道 
路 场景 ， 由 人 操纵 模拟 器 。 机 器 记录 下 来 场景 和 人 的 相应 动作 。 甚 至 
更 进一步 ，AI 营 驶 训练 员 开 着 车 在 北京 拥挤 不 堪 的 交通 中 每 日 罕 行 ， 
车 中 的 传感器 〈 摄 像 头 、 雷 达 等 ) 记录 下 来 各 种 复杂 的 场景 和 相应 的 
当 怠 员 的 动作 。 


在 工厂 生产 线 上 ， 人 类 训练 师 也 可 以 “手把手 ”地 教 机 械 辟 或 机 器 
人 学 会 某 些 特殊 性 的 序列 动作 。 


新 日 领 工种 


最 近 美 国政 府 的 一 份 报 告 提出 了 未 来 和 AI 有 关 的 相关 工作 ， 分 为 
以 下 四 类 。 


(1) 需要 与 AI 系统 一 起 工作 以 便 完 成 复杂 任务 的 参与 工作 (例如 
AI 辅助 医疗 诊断 ) 。 


(2) 开发 工作 ， 创 建 AI 技术 和 应 用 程序 (例如 数据 库 科学 家 和 软 
性 于 发作 


(3) 监控 或 维修 AI 系 统 的 工作 (例如 维护 AI 机 器 人 的 技术 人 


ll 


(4) 啊 应 AI 驱 动 的 范式 转变 的 工作 (例如 律师 围绕 AI 创 建 法 律 
框架 ， 或 创建 可 容纳 自动 区 驶 车辆 的 城市 规划 者 ) 。 


新 粉 领 工种 


机 需 最 难 取 代 的 驶 是 有 要求 高 度 情感 的 工作 ， 例 如 竖 幼儿 教育 ， 社 
会 工作 、 心 理 咨询 等 。 随 着 社会 老龄 化 ， 老 年 人 的 照顾 和 护理 将 成 为 
一 个 巨大 需求 。 目 前 这 个 需求 远 远 无 法 满足 的 原因 在 于 大 部 分 老年 人 
的 文 付 能 力 不 足 。 可 以 想象 类 似 美 国 给 低 收入 人 群 提供 的 食品 券 一 样 
给 老人 提供 “老年 照顾 券 ”( 在 手机 上 实现 支付 和 反 作 兹 都 很 简单 ) ， 
且 只 能 把 这 些 鲫 文 付 给 服务 机 构 。 未 来 甚至 会 出 现 “ 定 制 电话 煲 嘴 
员 ”“ 家 性 心理 咨询 师 ” 等 。 这 些 保 效 员 和 咨询 师 与 今天 的 电话 聊天 服务 
及 心理 咨询 师 的 最 大 不 同 是 他 们 不 仅 针 对 固定 的 客户 群 ， 而 且 服 务 十 
持续 的 。 未 来 甚至 会 出 现 专业 粉丝 团 ， 不 仅 是 为 明星 当 粉 丝 ， 还 可 以 
为 任何 需要 掌声 的 人 当 粉 丝 。 


女性 的 优势 


人 类 “生离死别 ”的 情感 都 兰 于 肉体 的 脆弱 和 生命 的 有 限 。 机 融 没 
有 这 些 限制 因此 不 具备 这 些 情感 ， 即 使 机 器 去 模拟 这 些 情 感 也 很 假 。 
女性 情感 比 男性 丰富 ， 所 以 比 男性 更 难 被 机 右 取 代 。 机 器 取 代 人 的 难 
易 程 度 从 易 到 难 将 是 四 肢 (体力 ) 一 小 脑 (模仿 性 工作 ) 一 大 脑 〈 推 
理 逻 辑 常 识 ) 一 心 (情感 ) 。 

未 来 一 个 新 工种 特别 适合 女性 ， 这 整 是 “机 器 解释 师 ”。 例 如 我 们 
去 看 病 ， 如 果 有 一 位 德高望重 的 名 医 说 “ 没 输 大 事 ， 回 去 多 喝 水 ， 休 朋 
两 天 束 好 了 ”， 这 病 有 可 能 会 好 一 半 。 因 为 人 体 许多 疾病 是 靠 目 己 的 免 
疫 系统 治 印 的 。 而 免疫 系统 的 功能 直接 和 心情 有 关 。 当 机 器 给 人 打印 


出 一 份 冷冰冰 的 诊断 报告 时 ， 患 者 不 会 有 老大 夫 拍 肩膀 安慰 的 放心 感 
觉 。 即 使 机 器 人 可 以 模仿 人 说 话 ， 也 是 假 模 假 样 的 。 至 少 在 可 见 的 未 
来 机 器 都 不 具备 真实 的 情感 ， 更 谈 不 上 同 理 心 、 同 情 心 等 人 类 复杂 的 
心理 活动 。 这 时 候 机 器 的 诊断 结果 需要 一 位 慈祥 的 女士 来 解释 给 患者 
听 。 这 位 女士 如 果 是 医生 当然 最 好 ， 但 有 一 些 医学 训练 的 护士 足 免 。 
这 位 “机 器 翻译 师 * 固 然 要 懂 医 学 ， 但 更 重要 的 是 懂 患 者 的 心理 ， 包 括 
了 解 患者 的 背景 和 观察 患者 的 语言 行为 。 

妇女 在 工业 时 代 的 社会 地 位 比 农业 社会 高 是 因为 机 器 取代 了 肌 
肉 ， 女 人 可 以 和 男人 一 样 灵巧 地 操纵 很 多 机 絮 。 在 信息 时 代 女 性 的 地 
位 进一步 提高 ， 因 为 信息 时 代 彻 底 抹 平 了 工作 对 肌肉 的 依赖 。 而 在 未 
来 的 养 能 时 代 ， 机 器 长 于 逻辑 弱 在 情感 ， 让 女性 比 男性 有 了 明显 的 优 
热 。 

AI 是 否 会 造成 大 量 失业 的 关键 在 于 AI 技术 发 展 的 速度 。 如 果 取 代 
过 程 缓慢 ， 那 么 失业 人 口 将 被 其 他 工作 逐渐 吸收 ， 失 业 人 口 也 有 时 间 
重新 学 习 技 能 。 

农业 人 口 在 1840 年 占 美国 总 劳动 力 人 口 的 70%， 目 前 只 有 2%。 在 
170 多 年 中 每 年 减少 0.7%， 这 样 很 容易 被 快速 发 展 的 工业 吸收 。 目 前 
美国 每 年 仍然 有 24 万 农业 人 口 离开 土地 ， 这 差不多 是 美国 一 个 月 新 增 
的 束 业 人 口 。 我 们 要 未 雨 绸 缪 的 是 如 果 AI 技 术 快 速 发 展 ， 在 一 代 人 的 
时 间 里 大 量 取 代 人 工 ， 那 么 我 们 将 会 看 到 怎样 一 个 社会 ? 


新 分 配制 度 ， 无 条 件 收入 还 是 无 条 件 培训 


如 采 社 会 出 现 大 规模 失业 ， 那 么 一 种 解决 方案 是 “无 条 件 基 本 收 
” (Universal Basic Income ，UBI) 制度 。 该 制度 很 简单 : 不 论 性 
`、 收入、 职业 、 教 育 情 况 ， 政 府 给 每 人 每 月 发 放 一 定 的 基本 生活 
， 包 括 束 业 人 口 。 从 美国 到 巴西 、 加 拿 大 、 人 芬兰、 纳米比亚、 肯 尼 


洪江 > 


亚 、 印 度 都 在 实验 UBI 。 瑞 士 2016 年 夏天 还 进行 过 一 次 关于 UBI 的 投 

票 ， 议 案 提 议政 府 给 所 有 成 年 公民 每 月 约 2 500 美 元 生活 费 ， 给 未 成 年 

人 每 月 600 美 元 。 投 票 的 结果 是 23% 赞成 ，77% 反对 ， 议 案 被 和 否决。 
支持 UBI 的 人 有 三 条 理由 。 


(1) 社会 上 有 许多 人 从 事 有 价值 的 工作 而 没有 收入 ， 例 如 全 职 母 
亲 。UBI 是 对 这 类 工作 价值 的 承认 。 


(2) 可 以 大 幅 缩小 贫 富 差距 。 美 国 阿 拉 斯 加 州 的 收入 平等 水 平 曾 
经 在 美国 各 州 排名 第 30 位 〈 数 目 越 大 越 不 平等 ) ， 自 从 1976 年 州 政府 
建立 了 石油 收入 支撑 的 永久 基金 并 给 每 个 公民 每 年 支付 1 000~2 000 美 
元 (看 当年 石油 价格 ) 后 ， 阿 拉 斯 加 州 的 收入 平等 水 平 在 美国 各 州 路 
升 到 第 二 位 。 纳 米 比 亚 2007 一 2012 年 的 实验 证 明 ， 实 施 一 年 后 贫困 率 
从 76% 降 到 37%， 在 6 个 月 内 儿 和 鞋 营养 不 良 率 从 42% 降 到 17%。 美 
国 “ 经 济 安全 项 目 ” 的 一 项 研究 表明 ， 给 美国 每 个 成 年 人 每 月 1 000 美 
元 ， 每 个 未 成 年 人 每 月 300 美 元 可 以 全 部 消除 贫困 。 (美国 人 口 3.24 
亿 ， 其 中 成 年 人 口 2.5 亿 ， 这 样 每 年 文 出 约 3.3 万 亿美 元 。 目 前 美国 联邦 
政府 总 预算 约 4 万 亿美 元 ， 联 邦 、 各 州 及 所 有 地 方 政府 的 财政 预算 总 和 
约 7 万 亿美 元 ， 占 GDP 的 35%。) 


(3) 可 以 提升 健康 水 平 ， 减 少 少年 儿童 辍学 ， 促 进 就 业 。 马 干 达 
的 一 项 “青年 机 会 计划 ”鼓励 青年 投资 目 己 的 技能 培训 ， 使 收入 提高 
38%。 纳 米 比 亚 的 实验 把 辍学 率 从 40% 降 到 了 零 。 


反对 UBI 的 人 也 有 三 个 理由 。 
(1) 把 本 来 该 给 穷人 的 钱 给 了 那些 并 不 需要 的 人 。 
(2) 避 励 好 吃 懒 做 。 
(3) UBI 需 要 的 那么 多 钱 从 哪儿 来 ? 


有 好 奇 的 读者 会 问 ， 为 什么 不 把 钱 只 给 穷人 ， 这 样 不 是 可 以 大 大 
降低 成 本 吗 ? 其 实 这 束 古 目前 各 国 实行 的 失业 救济 金 和 低 收 入 保障 。 


问题 旦 鉴别 谁 是 失业 人 口 和 需要 救济 的 人 口 的 成 本 很 高 ， 当 大 规模 失 
业 突 如 其 来 时 无 法 应 付 。 


笔者 认为 ，UBI 最 大 的 问题 在 于 太 昂 贵 ， 其 他 都 不 是 问题 。 笔 者 
建议 与 其 实行 无 条 件 基 本 收入 ， 不 如 实行 “无 条 件 基 本 培 
训 ” (Universal Basic Training，UBT) ， 即 对 所 有 愿意 工作 的 成 年 人 提 
供 培训 费用 。 这 笔 钱 并 不 发 给 个 人 ， 而 是 发 给 培训 机 构 (要 有 措施 防 
止 作 浆 ) 。 受 培训 的 成 年 人 只 有 通过 第 三 方 考试 机 构 的 相应 考试 后 才 
能 免除 这 笔 培训 费用 。 以 目前 的 个 人 识别 技术 《指纹 、 刷 脸 等 ) ， 这 
些 考 试 可 以 轻易 在 线 举行 。 由 于 这 些 培训 项 目 针 对 的 是 那些 失业 者 ， 
学 习 重 新 就 业 的 技能 需要 花 时 间 精 力 ， 所 以 不 是 真正 需要 工作 的 人 或 
者 有 不 错 收入 的 人 不 会 去 占 这 个 便宜 。 还 以 美国 为 例 ， 目 前 失业 率 已 
经 达到 3.9% ， 约 608 万 人 ， 已 经 达到 了 充分 就 业 率 。 假 设 目前 失业 率 
为 10%， 而 我 们 希望 达到 4%， 这 样 大 约 有 960 万 人 需要 通过 培训 就 
业 。 假 设 每 人 每 年 职业 培训 费用 为 1 万 美元 ， 每 年 的 总 培训 费用 为 960 
亿美 元 ， 这 只 是 UBI 3.3 万 亿美 元 的 3%， 占 美国 GDP 的 0.5%。 即 使 失 
业 率 达到 20%， 培 训 费 用 达到 2 560 亿 美元 ， 也 分 别 只 是 UBI 成 本 的 8% 
和 美国 GDP 的 1.3% 。 


贫 富 芒 殊 解 决 之 道 ， 民 间 公 益 


过 去 100 年 来 的 技术 进步 惠及 了 所 有 的 人 ， 但 是 分 布 却 极 不 均衡 。 
虽然 每 个 人 的 绝对 生活 水 平 都 大 幅 提 高 ， 但 相对 差别 不 是 减少 而 是 增 
加 了 。 图 7.1 是 把 美国 地 图 面积 作为 美国 的 总 财 定 来 直观 显示 不 同 阶层 
人 群 在 总 财富 里 的 占 比 。 


1% 上 的 人 口 会 


拥有 这 些 


20% 的 人 口 “了 


会 拥有 这 些 


图 7.1 美 国 不 同 阶层 人 群 占有 财富 的 比例 


图 片 来 源 : http://owsposters.tumblr.com/post/11944143747/if-us-land-mass-were-distributedlike- 
us。 


如 图 7.1 所 示 ， 美 国 最 富有 的 1% 的 人 口 占 有 几乎 40% 的 财富 ， 最 
二 有 的 10% 的 人 口 占 有 80% 的 财富 。 最 穷 的 40% 的 人 口上 只 占有 不 到 
1% 的 财 宣 。 在 世界 各 国 里 ， 美 国 的 贫 富 差距 还 不 是 最 大 的 ， 中 国 、 
巴西 、 墨 西 哥 都 比美 国 贫 富 差距 更 大 。 图 7.2 是 世界 各 国 的 基尼 系数 
(系数 越 大 ， 贫 富 差 距 越 大 ) 


巴西 55 
墨西哥 48 
中 国 47 

美国 41 
俄罗斯 40 
意大利 36 

英国 36 

澳大利亚 35 
西班牙 35 

印度 33 

法 国 33 
加 拿 大 33 

韩国 32 

德国 28 

日 本 25 

注 : 0= 收 入 完全 平等 ，100= 收 入 最 不 平等 


图 7.2 世 界 各 国 的 基尼 系数 

图 片 来 源 : http://www.kkr.com/global-perspectives/publications/china-transition 。 

美国 的 仙 富 差距 主要 由 三 个 因素 造成 。 一 古代 际 传递 ， 富 人 的 遗 
产 留 给 孩子 ， 资 本 增值 比 劳 动 增值 更 快 ， 因 此 富 的 越 定 ， 穷 的 越 穷 。 
二 是 全 球 化 劳动 力 流动 性 增加 ， 加 工业 和 制造 业 大 批 流向 以 中 国 为 主 
的 发 展 中 国家 ， 造 成 大 批 蓝领 失业 。 三 是 科技 使 财富 向 科技 创业 成 功 
者 高 度 集 中 。 中 国 的 贫 定 差 距 也 有 三 个 原因 ， 其 中 有 两 个 和 美国 不 
同 ， 一 个 相同 。 第 一 个 不 同 是 过 去 城乡 二 元 政策 造成 的 广大 农村 的 数 
亿 仙 困 人 口中 仍然 有 相当 一 部 分 没有 脱贫 。 第 二 个 不 同 古国 家 控制 的 
资源 有 相当 一 部 分 在 权 钱 交换 中 集中 到 少数 人 手中 。 和 美国 相同 的 
古 ， 科 技 使 财富 向 科技 创业 成 功 者 涌 集 。 注 意 前 两 者 通 凋 伴随 着 对 轮 


势 群 体 或 贫困 人 群 的 刊 夺 ， 也 束 是 它们 不 仅 使 证人 更 主 ， 也 使 穷人 更 
穷 ， 而 科技 进步 造成 的 贫 富 差别 只 是 让 富 人 更 富 但 并 没有 让 穷人 更 
穷 。 随 着 扶贫 计划 的 开展 和 转移 文 付 的 加 大 ， 农 村 的 绝对 贫困 人 口 会 
逐渐 减少 。 随 着 法 治 的 健全 ， 权 钱 交 换 也 会 被 抑制 。 只 有 科技 进步 造 
成 的 贫 富 相对 老 距 目前 并 没有 好 的 解决 之 道 。 法 国 经 济 学 家 托马斯 ' 皮 
邮 蒂 (Thomas Piketty) 在 《21 世 纪 资 本 论 》 中 建议 征收 “财富 税 ”， 即 
针对 每 个 人 拥有 的 所 有 财产 (包括 房产 、 证 券 、 现 金 、 保 险 等 ) 每 年 
征收 1%~2% 的 税 。 这 个 税种 不 仅 严 重 抑制 企业 家 创新 动力 ， 而 且 把 钱 
交 给 政府 效率 一 定 很 低 。 丹 老 曾 经 征收 过 财富 税 ， 在 20 世 纪 80 年 代 后 
期 该 财 是 税 最 高 达到 2.2%， 也 即 你 的 财富 如 有 果 不 增值 45 年 束 补 国家 征 
光 了 。 实 践 证 明 这 个 税种 在 抑制 经 济 发 展 的 同时 并 未 缩小 贫 晤 差距 ， 
丹麦 目 1997 年 后 束 取 消 了 这 个 税种 。 其 他 一 些 宦 裕 欧 洲 国家 也 都 有 类 
似 笑 试 ， 最 后 者 取消 了 这 个 税种 。 

缩小 负 富 差距 的 一 个 可 行 的 方案 束 是 通过 民间 公益 。 比尔: 蓄 次 现 
在 全 职 做 公益 ， 他 和 巴菲特 把 99% 的 财产 都 捐 出 来 ， 要 在 有 生 之 年 全 
部 花 在 公益 上 “。 他 人 花 目 己 闻 枯 赚 来 的 钱 一 定 比 政府 伦 别 人 的 钱 用 心得 
多 。 作 为 一 个 成 功 企业 家 ， 他 选择 目 己 认可 的 项 目 ， 执 行 项 目 、 评 舍 
项 目的 能 力 都 远 高 于 一 般 政府 官员 ， 这 里 几乎 不 会 有 跑 冒 滴漏 和 贪 
腐 。 更 重要 的 是 ， 当 大 批 成 功 企业 家 都 投入 公益 时 ， 会 目 然 形成 一 
个 “公益 市 场 ”。 企 业 家 不 仅 可 以 根据 目 己 的 资源 、 爱 好 和 优势 选择 公 
益 方 同 ， 效 率 差 的 公益 项 目 也 会 补 目 然 淘 状 。 

无 论 是 比尔 :再 葡 还 是 马云 ， 他 们 个 人 和 家 庭 所 能 请 耗 的 财富 在 他 
们 目 己 的 财富 中 都 微不足道 。 聪 明 的 家 长 都 知道 留 给 孩子 太 多 钱 是 祸 
害 ， 所 以 中 外 很 多 的 成 功 企业 家 都 将 目 己 的 大 部 分 财富 ， 在 他 们 有 生 
之 年 全 部 伦 到 目 己 认 为 重要 的 公益 项 目 中 去 。 作 为 政府 ， 应 该 通过 一 
系列 法 律 政 策 或 励 民间 公益 ， 文 持 形 成 一 个 公益 市 场 和 公益 生态 。 这 
样 不 仅 避免 了 高 税收 造成 的 创业 意愿 降低 ， 避 免 了 征 税 成 本 和 文 付 中 
的 损耗 ， 更 重要 的 是 能 够 以 最 高 的 效率 和 最 创新 的 方式 缩小 贫 盟 差 
距 。 


改善 贫 富 差距 的 第 二 个 方案 是 增加 休息 日 和 延长 假期 。 一 个 令 人 
匪夷所思 的 现象 是 当中 国 从 每 周 工作 六 天 改变 为 每 周 工作 五 天 时 ， 
GDP 不 仅 没有 下 降 相应 的 16， 反 而 持续 增长 。 经 济 学 家 的 解释 是 多 出 
一 天 的 休息 时 间 增加 了 消费 ， 前 提 是 人 们 普遍 拥有 积蓄 ， 但 没有 时 间 
消费 。 根 据 同样 的 原理 ， 可 以 将 五 天 工作 制 改 为 四 天 、 三 天 。 也 可 以 
进一步 延长 假期 ， 例 如 除了 春节 以 外 ， 清 明 、 端 午 、 中 秋 都 变 为 长 假 
期 。 每 年 的 年 假 也 可 以 延长 到 三 周 、 四 周 ， 甚 至 可 以 考虑 让 家 长 和 芒 
子 一 起 放 署 假 和 寒假 。 逐 渐 增 加 休息 时 间 ， 带 来 了 消费 的 增加 ， 所 以 
总 体 GDP 并 不 一 定 会 下 降 。 对 企业 来 讲 ， 每 个 人 的 工作 时 间 变 短 ， 要 
完成 同样 的 工作 量 ， 意 味 着 需要 增加 和 人手 ， 这 样 就 会 降低 失业 率 。 那 
读者 要 问 ， 这 样 岂 不 是 增加 了 企业 的 成 本 吗 ? 如 果 全 社会 都 是 同样 的 
劳动 时 间 ， 企 业 利润 的 长 期 决定 因素 则 是 市 场 愿 意 支付 的 价格 。 企 业 
为 了 保持 一 定 的 利润 ， 要 么 提高 效率 ， 要 么 削减 工资 ， 前 者 推动 创 
新 ， 后 者 则 是 一 种 市 场 化 的 也 即 无 损耗 的 转移 支付 。 

不 论 是 “无条件 基本 收入 * 还 是 大 幅 增加 休息 时 间 都 属于 比较 激进 
的 应 对 大 规模 失业 的 措施 。 笔 者 不 认为 尤 瓦尔 赫 拉 利 所 担心 的 大 规模 
失业 会 突然 出 现 。 基 于 对 目前 技术 的 理解 和 近年 来 商业 的 发 展 ，AI 对 
产业 的 影响 虽然 是 颠覆 性 的 ， 但 不 会 在 一 夜 之 间 发 生 。 


权力 再 分 配 


历史 上 每 次 技术 音 命 都 会 改变 权力 的 分 配 。 过 去 40 年 的 信息 
让 每 个 人 可 以 及 时 得 到 信息 ， 及 时 传播 思想 ， 大 大 增加 了 个 人 的 力 
量 。 技 术 单 命 甚至 会 改变 地 缘 政 治 。 在 汽车 时 代 之 前 ， 中 东 是 世界 上 
最 俩 穷 的 地 方 之 一 ， 也 非 大 国 博弈 之 处 ， 一 旦 世界 进入 依赖 石油 的 时 
代 ， 中 东 的 产 油 国 播 身 一 变 成 为 巨 富 ， 这 些 战 略 财富 也 引发 了 许多 战 


和 争 。 当 有 一 天 大 街 上 全 部 都 是 电动 汽车 时 ， 中 东 可 能 又 变 回 到 大 家 不 
感 兴趣 的 沙 六 地 市 ， 而 富 产 电池 原料 的 刚果 则 变 成 大 国 必 争 之 地 。 

技术 革命 把 权力 在 政府 、 企 业 和 个 人 三 者 之 间 重 新 分 配 ， 并 不 一 
定 每 次 都 倾 问 于 个 人 。 例 如 当 计 算 机 还 在 大 型 机 阶段 时 ， 大 型 机 的 霸 
主 IBM 成 为 美国 最 有 权力 的 公司 之 一 。 个 人 电脑 草 命 的 社会 动力 是 美 
国 的 一 批 年 轻 人 感到 未 来 信息 时 代 被 一 家 公司 (当时 是 IBM) 控制 非 
常 恕 怖 ， 所 以 第 一 个 微 处 理 器 芯片 刚 问 世 ， 束 立即 得 到 了 这 批 年 轻 人 人 
的 热烈 拥抱 。 乔 布 斯 、 蓄 次 的 理想 是 每 个 人 都 能 拥有 目 己 的 电脑 。 个 
人 电脑 和 互联 网 蝇 无 疑问 会 极 大 地 给 个 人 赋 能 ， 增 加 个 人 的 权力 ， 但 
后 来 的 大 数据 和 云 计 算 则 相反 ， 又 把 权力 转移 到 了 大 公司 和 政府 手 
中 。 许 多 国家 的 政府 对 互联 网 一 开始 都 持 怀 疑 和 谍 慎 态度 ， 但 它们 对 
大 数据 和 云 计算 从 一 开始 束 热 烈 拥 抱 。 因 为 大 数据 和 云 计算 不 仅 需 要 
巨大 的 资源 ， 而 且 集 中 在 一 起 (在 数据 中 心 ) 易于 控制 ， 更 重要 的 是 
大 数据 可 以 增加 政府 对 社会 的 管理 和 控制 能 

那么 这 次 的 AI 痕 潮 又 会 造成 什么 样 的 权力 分 配 呢 ?在 过 去 几 年 中 
我 们 明显 看 到 AI 进 一 步 将 权力 集中 到 大 公司 和 政府 手中 。AI 的 核心 次 
源 是 处 理 心 片 和 数据 ， 目 前 心 片 集 中 在 以 英 伟 达 为 首 的 少数 几 家 心 
公司 手中 。 数 据 则 分 为 三 类 ， 第 一 类 是 互联 网 用 户 或 者 消费 者 数据 ， 
目前 集中 在 世界 互联 网 公司 巨头 手中 。 第 二 类 是 行业 数据 ， 例 如 医 
疗 、 人 金融 等 ， 集 中 在 行业 的 龙头 公司 手中 。 第 三 类 是 社会 数据 ， 集 中 
在 政府 手中 。 许 多 AI 的 应 用 由 于 和 大 数据 不 可 分 离 ， 目 然 是 给 大 公司 
或 政府 赋 能 。 例 如 人 入 脸 识别 技术 从 一 开始 就 得 到 中 国政 府 的 大 力 文 
持 ， 在 全 国 授 地 开花 。 在 短 短 的 几 年 中 ， 从 文 付 到 购物 再 到 出 行 都 已 
经 开始 “ 刷 脸 *。 现 在 全 国 已 经 有 上 亿 个 监控 摄像 涉 ， 未 来 更 会 做 到 无 

AI 技术 有 可 能 给 个 人 赋 能 吗 ?” 目前 看 来 可 能 有 两 个 方 网 。 一 个 方 
问 是 手机 中 的 AI 功能 ， 例 如 物体 识别 、 智 能 助理 和 目 然 语言 理解 等 。 
因为 手机 给 个 人 赋 能 ， 凡 征 增加 手机 能 力 的 都 能 增加 个 人 能 力 。 第 二 


个 方 同 是 AI 的 资源 开源 化 ， 这 里 包括 源 代 码 、 程 序 库 和 云端 AI 能 
这 些 AI 资 源 的 普及 将 使 人 们 在 AI 领 域 的 创业 成 本 降低 ， 几 个 聪明 的 孩 
子 束 可 以 做 大 公司 做 不 了 的 事情 。 


是 否 该 信任 机 器 的 决定 


随 看 机 器 学 习 能 力 的 增加 和 了 瞳 知识 的 大 爆炸 ， 未 来 越 来 越 多 的 决 
定 将 交 给 机 器 去 做 。 这 些 决 定 可 以 从 奖 病 的 诊断 到 职业 的 选择 ， 可 以 
从 商业 的 决策 到 政策 的 制定 ， 甚 至 战争 的 决策 ， 许 多 决定 率 涉 巨大 的 
经 济 利益 甚至 人 命 。 当 人 类 无 法 做 出 最 适当 的 决定 时 ， 有 是 否 该 信任 机 
器 的 决定 ? 

要 回答 这 个 问题 ， 我 们 需要 把 机 需 决 定 的 场景 分 为 两 类 : 第 一 类 
征 反复 出 现 的 场景 ， 第 二 类 是 从 来 没 出 现 过 的 场景 。 


第 一 类 场景 的 典型 是 目 动 当 驶 。 在 这 类 场景 中 ， 人 类 对 机 融 的 信 
任 和 今天 对 一 家 大 型 客机 上 软件 的 信任 没有 本 质 区 别 。 只 要 场景 是 反 
复出 现 的 并 且 有 时 间 去 测试 ， 我 们 束 可 以 通过 长 时 间 的 测试 来 验证 机 
右 的 可 靠 性 ， 这 正 古 今天 所 有 目 动 驾驶 公司 在 做 的 事 : 经 年 素 月 地 在 
大 街 上 当 独 ， 不 断 提 高 可 靠 性 。 这 类 场景 还 有 一 种 情况 是 疾病 诊断 ， 
虽然 机 器 是 第 一 次 对 有 某 个 病人 下 诊断 ， 但 机 需 已 经 正确 地 诊断 了 许多 
其 他 类 似 的 病人 。 所 以 不 论 是 个 人 生活 中 的 决策 ， 还 是 商业 决策 ， 只 
要 机 妖 有 过 在 类 似 场 景 下 大 量 的 测试 ， 就 可 以 信任 机 器 。 当 然 这 里 不 
排除 机 需 出 错 的 概率 ， 这 和 不 排除 有 经 验 的 医生 误诊 ， 不 排除 大 型 客 
机 的 软件 出 故障 一 样 。 


第 二 类 场景 的 典型 是 一 场 战 争 的 决策 。 机 右 很 难 有 在 实际 战争 中 
有 反复 测试 的 机 会 ， 即 使 有 ， 每 场 战 争 的 性 质 也 大 不 相同 。 在 这 种 场合 
人 必须 负 起 贡 任 。 那 是 不 是 说 机 如 在 这 种 场合 整 完全 没 用 了 呢 ? 不 
是。 如 有 宁 能 有 历史 战争 数据 ， 比 如 战场 的 视频 和 卫星 图 片 ， 机 右 仍 然 


可 以 从 这 些 海量 信息 中 发 现 隐蔽 的 关系 ， 也 即 瞳 知识 。 机 器 也 可 以 模 
拟 战 争 场景 ， 就 像 今 天 自动 驾驶 系统 也 可 以 用 模拟 环境 训练 一 样 。 所 
以 即使 机 器 无 法 在 实际 场景 中 测试 ， 仍 然 有 可 能 为 人 类 决策 提供 辅助 
支持 。 


数据 如 何 共 享 


AI 应 用 依赖 数据 ， 数 据 越 多 、 越 广 ，AI 优 化 的 效果 就 越 好 。 目 前 
的 数据 都 是 一 个 一 个 的 孤岛 ， 占 有 数据 的 机 构 不 一 定 能 最 有 效 地 利用 
数据 。 目 前 占有 数据 的 企业 没有 动力 把 自己 的 数据 分 享 给 别人 ， 要 解 
决 数据 共享 必须 解决 以 下 两 个 问题 。 

第 一 ,动力 机 制 。 共 享 的 好 处 是 什么 或 者 不 共享 的 坏处 是 什么 ? 
一 个 方案 是 建立 数据 交易 平台 。 提 供 数据 可 以 赚钱 ， 使 用 数据 要 付 
费 。 这 里 的 核心 是 根据 数据 的 数量 和 质量 对 数据 进行 定价 。 

第 二 ， 隐 私 与 安全 。 企 业 的 数据 涉及 用 户 隐私 或 企业 机 密 。 用 户 
的 身份 信息 必须 隐 挤 ， 这 样 即使 信息 被 破解 也 无 法 对 用 户 造成 伤害 。 
企业 的 数据 也 需要 加 密 ， 这 样 即使 数据 共享 平台 也 无 法 看 到 信息 。 如 
何 既 能 加 密 又 能 使 用 数据 则 是 目前 的 一 个 研究 热点 。 以 目前 的 分 布 式 
数据 技术 ， 企 业 的 数据 不 必 离 开 自己 的 服务 器 或 数据 中 心 ， 这 样 分 享 
数据 的 企业 心里 更 踏实 。 

同样 的 道理 ， 政 府 也 应 该 根据 上 述 原则 尽 可 能 公开 数据 。 这 些 数 
据 本 来 就 是 公共 资源 ， 是 比 金 矿 更 好 的 资源 ， 金 矿 一 个 人 挖 完了 第 二 
个 人 就 挖 不 到 了 ， 数 据 矿 可 以 让 成 千 上 万 人 用 不 同 的 方法 挖 到 不 同 的 
宝贝 。 


目 苯 的 来 源 


不 论 采 取 什 么 样 的 措施 ， 如 果 机 器 代 若 人 工 的 势头 来 得 太 猛 烈 ， 
大 规模 的 结构 性 失业 总 十 很 难 避 人 免 的 。 一 种 极端 的 情况 是 当 某 些 行业 
彻 克 被 机 器 取代 后 ， 该 行业 的 相当 一 部 分 从 业 人 员 再 也 没有 能 力 掌握 
其 他 行业 的 束 业 技能 。 如 采 这 个 群体 很 大 ， 束 会 变 成 一 个 社会 问题 。 
对 这 部 分 人 群 除了 给 予 基 本 生活 救济 以 外 ， 还 应 该 关注 他 们 的 心理 健 
康 。 其 中 最 重要 的 钙 目 苯 感 的 来 源 。 长 期 失业 的 人 即使 基本 生活 有 保 
隐 ， 也 会 形 失 价值 感 。 他 们 在 家 庭 和 社会 中 也 会 感觉 低 人 一 等 ， 长 此 
以 往 会 造成 抑郁 ， 导 致 柄 酒 甚至 吸毒 。 一 个 人 的 目 划 主要 来 目 对 社会 
和 他 人 的 贡献 ， 可 以 和 金钱 无 大 。 所 以 获得 目 草 的 一 个 重要 途径 是 参 
加 各 种 社会 公 丛 组 织 ， 在 公益 组 织 中 不 仅 能 够 找到 目 己 的 价值 ， 而 且 
能 找到 群体 的 归属 感 。 这 惑 要 求 社 会 大 力 鼓 励 发 展 各 种 类 型 的 公益 组 
织 ， 让 每 个 人 都 能 找到 目 己 愿意 参加 的 公益 活动 。 任 何 一 个 社会 都 会 
有 大 量 的 服务 性 工作 无 法 由 商业 完成 ， 因 为 商业 要 产生 利润 ， 而 有 些 
被 服务 的 人 群 没 有 相应 的 支付 能 力 ， 例 如 贫困 和 部 分 老年 人 群 。 这 
些 “| 内 人 ”相互 之 间 的 服务 也 是 一 个 很 大 的 需求 ， 这 束 是 开玩笑 说 的 “你 
给 我 揉 肩 ， 我 给 你 手 育 ”。 

目 苯 的 第 二 个 来 源 古 个 人 独特 的 价值 ， 包 括 比 周围 人 更 好 的 技能 

(人 体育、 游戏、 音乐 、 舞 蹈 、 绘 画 、 阅 读 、 讲 笑话 、 养 生 、 健 身 、 手 

工 等 ) 。 这 些 才 能 才 忆 的 开发 和 发 挥 同样 需要 社会 公益 组 织 ， 即 组 织 
各 种 爱好 者 俱乐部 。 这 些 形形色色 的 社会 公益 组 织 可 以 由 富 容 人 群 捐 
助 。 

如 果 政 府 能 够 给 这 些 无 法 再 束 业 的 人 群 提供 一 个 基本 生活 保障 ， 
通过 形形色色 的 社会 公益 组 织 再 给 这 些 人 提供 尊严 感 和 归属 感 ， 这 个 
人 和 群 的 幸福 感 束 会 大 大 加 强 。 


机 器 会 产生 自我 意识 吗 


包括 马 斯 元 、 和 霍金 等 人 都 非常 担心 AI 有 一 天 会 控制 人 类 。 在 机 恬 
能 控制 人 类 之 前 ， 机 器 必须 产生 自我 意识 。 上 自我 意识 是 一 个 复杂 问 
题 ， 到 今天 都 没有 公认 的 严格 定义 ， 但 大 致 上 目 我 意识 是 指 一 个 人 对 
自己 存在 的 知觉 ， 或 者 说 明确 知道 自己 和 周围 的 环境 (他 者 ) 的 区 
别 。 人 的 目 我 意识 并 非 天 生 束 有 ， 而 是 儿童 在 大 约 18 个 月 开始 产生 
的 。 纽 约 州立 大 学 奥 尔 巴 尼 校 区 的 戈 登 . 盖 洛 普 教授 (Gordon Gallup) 
在 1970 年 设计 了 一 个 简单 巧妙 的 测试 自我 意识 的 实验 。 实 验 是 这 样 进 
行 的 : 先 让 一 个 儿童 看 到 镜子 里 的 自己， 然后 在 不 让 他 守 觉 的 情形 下 
在 他 的 脸颊 上 贴 上 一 张 明 显 的 记号 〈 例 如 一 张 红 色 的 圆 点 纸 ) ， 再 让 
孩子 对 着 镜子 。 如 果 孩 子 去 摸 目 己 脸 上 这 个 记号 或 试图 手下 来 ， 这 个 
孩子 束 被 认为 具有 了 自我 意识 。 实 验证 明 ， 只 有 达到 一 定年 龄 (例如 
18 个 月 ) 的 孩子 才 会 有 自我 意识 。 科 学 家 还 对 几 十 种 动物 包括 十 几 种 
猴子 做 了 这 个 实验 ， 只 有 黑猩猩 这 一 种 动物 能 够 通过 这 个 测试 。 而 其 
他 动物 不 管 在 镜子 前 待 多 长 时 间 ， 永 远 都 会 把 镜子 里 的 自己 当成 “ 别 
人 ，。 

具有 目 我 意识 是 灵 长 类 动物 和 其 他 动物 的 本 质 区 别 ， 这 使 人 类 在 
进化 中 获得 了 巨大 优势 。 人 类 可 以 从 * 上 自己 ”的 视角 观察 、 认 知 和 理解 
世界 ， 并 最 终 根 据 目 己 的 意愿 改造 世界 。 人 类 根据 自己 的 知觉 记忆 的 
清晰 程度 开始 有 了 “时 间 ” 概 念 。 随 着 “时 间 ” 概 念 的 产生 ， 人 类 可 以 想 
象 多 种 不 同 的 “未 来 ”， 即 那些 未 曾 发 生 的 事情 ， 创 造 力 产 生 了 。 人 类 
获得 目 我 意识 的 最 大 代价 束 是 必须 面 对 一 个 无 法 理解 的 事实 : 目 我 意 
识 终 将 消失 ,“ 目 己 ” 终 将 死亡 。 对 死亡 的 念 惧 成 为 伴随 人 一 生 的 您 
慢 。 一 旦 获得 了 自我 意识 的 “自己 ”， 就 再 也 无 法 理性 地 理解 “自己 ”的 
消失 ， 所 以 几乎 全 世界 所 有 的 宗教 都 是 从 “ 非 理 性 * 或 “超级 存在 ”的 角 
度 回 应 死亡 的 问题 ， 至 少 能 提供 某 种 解释 减少 人 类 对 死亡 的 恐 乙 。 


近年 来 随 着 脑 成 像 仪 器 的 成 熟 ， 天 于 意识 的 研究 有 了 许多 实验 性 
的 发 现 。 用 于 大 脑 研 究 的 主要 成 像 仪 右 是 功能 性 核 磷 共振 成 像 仪 ， 该 
成 像 仪 的 原理 如 下 ， 当 大 脑 某 部 分 神经 元 沿 活 产生 电 脉 冲 信 和 号 时 ， 整 
会 有 合 氧 量 高 的 新 鲜血 液 流 到 该 部 分 大 脑 去 蔡 换 原先 氧气 已 经 耗 尽 的 
血 和 被 。 由 于 缺 氧 血液 的 磁性 比 语 氧 血 液 高 ， 所 以 在 磁场 中 会 至 现 不 同 
的 信号 强度 。 借 此 原理 ， 核 磁 共 振 成 像 仪 下 可 以 看 出 大 脑 中 哪 部 分 神 
经 元 正在 活跃 。 科 学 家 可 以 用 功能 性 核磁 共振 判断 一 个 人 是 否 有 意 
识 。 该 实验 要 求 被 实验 者 想 一 个 动作 如 打 网 球 ， 从 成 像 仪 上 可 以 看 到 
一 个 正常 清醒 的 人 的 大 脑 皮 质 的 某 一 个 特定 区 域 活 跃 。 实 验 表 明 大 多 
数 人 在 想 同 一 个 动作 时 相同 的 脑 区 域 活路 。 这 样 束 可 以 用 实验 判断 一 
个 对 外 来 信号 没有 任何 肢体 和 表情 反应 的 “植物 人 ?是 否 已 经 起 失 了 意 
识 。 如 果 该 “植物 人 ” 听 到 指令 后 对 应 的 大 脑 皮 质 部 位 活路 束 可 以 认为 
他 仍然 具有 意识 。 


加 利 福 尼 亚 州 理工 学 院 的 克里斯托弗 . 科 赫 (Christof Koch) 教授 
通过 检测 单个 神经 元 信号 发 现 当 被 实验 者 看 到 自己 熟悉 的 影像 时 ( 例 
如 喜爱 的 电影 演员 ) ， 某 一 个 神经 元 会 被 激发 而 其 他 神经 元 没有 动 
静 。 每 次 看 到 这 个 演员 的 不 同 照片 时 ， 同 一 个 神经 元 都 会 被 激发 。 甚 
至 在 看 到 这 个 演员 的 名 字 时 ， 同 一 个 神经 元 也 会 被 激发 。 但 如 果 看 到 
这 个 演员 和 其 他 人 的 合影 时 ， 这 个 神经 元 就 不 会 被 激发 。 

单个 的 神经 元 虽然 可 以 和 外 界 刺激 建立 一 对 一 的 对 应 关系 ， 但 是 
这 还 不 是 目 我 意识 。 目 前 公认 的 上 自我 意识 是 许多 神经 元 共同 的 作用 。 
位 于 美国 威斯康星 州 的 精神 病 学 研究 所 (Psychiatric Institute and 
Clinic) 设计 了 一 种 精妙 的 实验 用 于 证 实意 识 在 大 脑 的 存在 是 一 个 整 
体 ， 而 不 是 某 个 部 分 。 仪 器 类 似 我 们 前 面 提 到 过 的 章 在 头 上 的 “电极 
置 >， 电 极 尝 上 布 满 了 电极 ， 可 以 接收 到 来 和 目 大 脑 皮 质 不 同 部 位 的 电信 
号 。 另 外 一 个 能 发 射 伐 场 的 电极 在 脑壳 的 不 同 部 位 发 射 磁 脉 冲 。 每 个 
磁 脉 冲 都 能 引起 大 脑 神 经 元 的 激发 ， 通 过 分 布 在 头 上 不 同位 置 的 电极 
残 可 以 观察 到 大 脑 不 同 部 位 神经 元 的 活动 。 实 验 发 现 当 受 试 者 清醒 
上 时， 每 次 脑 外 刺激 信号 在 脑 内 不 同 的 区 域 都 会 造成 激发 ， 先 是 离 刺 激 


电极 最 近 的 区 域 激 发 ， 然 后 这 种 激发 先后 传导 到 大 脑 皮 质 的 不 同 区 
域 ， 这 些 激活 区 域 形 成 复杂 的 图 案 。 但 当 受 试 者 入 睡 后 再 刺激 ， 发 现 
只 有 刺激 电极 附近 的 区 域 被 激活 ， 并 不 会 传导 到 其 他 区 域 。 这 个 实验 
证 明了 意识 是 大 脑 不 同 区 域 互相 传导 连通 后 的 共同 结果 ， 而 不 是 某 个 
部 分 。 

遗憾 的 是 以 上 的 脑 神经 研究 仍然 无 法 精准 地 定位 意识 在 大 脑 中 到 
底 是 以 什么 样 的 方式 产生 和 存在 的 。 但 这 些 研 究 已 经 能 够 给 我 们 一 些 
启示 来 回答 : 以 神经 网 络 为 基础 的 人 工 智能 是 否 能 在 不 远 的 将 来 产生 
自我 意识 呢 ? 

首先 ， 如 果 我 们 能 够 确认 “自我 意识 无非 是 大 量 神经 元 之 间 复 灯 
的 激活 和 连接 模式 ， 那 么 我 们 应 该 可 以 预测 未 来 有 一 天 当 基 于 半导体 
或 生物 芯片 的 神经 网 络 足 够 复杂 时 ， 机 器 完全 可 能 产生 自我 意识 。 但 
这 个 神经 网 络 要 多 么 复杂 呢 ? 

第 一 个 问题 是 神经 元 的 数量 。 人 类 大 脑 大 约 有 1 000 亿 个 神经 元 ， 
每 个 神经 元 会 有 上 千 个 突 触 和 其 他 神经 元 相连 接 ， 也 就 是 说 人 脑 有 约 
100 万 亿 个 连接 。 目 前 谷歌 大 脑 已 经 达到 了 1 万 亿 个 连接 ， 芯 片上 晶体 
管 的 密度 增加 速度 已 经 开始 放 缓 ， 以 远 慢 于 摩尔 定律 (每 18 个 月 翻 
番 ) 的 速度 发 展 。 增 加 计算 能 力主 要 是 靠 多 核 ， 即 把 许多 CPU/GPU 封 
装 在 一 起 。 按 目前 的 发 展 速 度 来 看 ， 最 多 20~30 年 机 器 神经 网 络 就 能 够 
达到 人 脑 的 连接 数 。 但 是 神经 元 和 连接 数量 只 是 一 个 必要 条 件 ， 即 使 
达到 或 超过 人 脑 的 数量 也 未 必 能 产生 自我 意识 。 

第 二 个 问题 是 神经 元 之 间 的 连接 方式 。 目 前 的 机 器 神经 网 络 为 了 
数学 上 可 以 分 析 ， 工 程 上 实现 方便 ， 神 经 元 都 是 简单 清楚 地 分 成 许多 
层级 。 每 个 神经 元 要 么 是 只 和 下 一 层级 的 神经 元 相连 (例如 全 连接 网 
络 或 卷 积 网 络 ) ， 要 么 是 只 和 自己 相连 (例如 RNN) 。 但 人 脑 中 的 神 
经 元 根本 没有 清晰 的 层级 ， 而 是 在 一 个 三 维 空 间 随 机 的 、 复 杂 的 互 
联 。 已 知 的 连接 有 短 连 接 和 长 连接 ， 前 者 是 附近 的 神经 元 之 间 的 连 
接 ， 后 者 是 和 很 远 的 神经 元 之 间 的 连接 。 


第 三 个 问题 是 目前 的 人 工 神经 网 络 的 信号 输出 是 上 一 级 输入 加 权 
求 和 后 被 一 个 门限 截断 的 信和 号， 而 人 脑 中 每 个 神经 元 的 信号 强 弱 、|] 
限 的 高 低 都 可 能 不 同 。 也 就 是 说 目前 的 人 工 神 经 网 络 古 对 人 脑 大 大 简 
化 后 的 模仿 ， 这 种 简化 模仿 即使 达到 了 相同 的 神经 元 和 连接 数 也 不 一 
定 能 够 达到 人 脑 的 复杂 程度 。 


除了 以 上 三 个 问题 之 外 ， 更 重要 的 是 第 四 个 问题 ， 人 脑 中 各 处 充 
满 了 随机 性 ， 深 受 外 界 环境 的 影响 ， 这 种 复杂 系统 中 的 随机 性 生产 
生 “ 涌 现 ” 的 重要 条 件 。 (“涌现 ”是 复杂 系统 中 的 一 个 概念 ， 比 如 含有 
足够 复杂 的 无 机 化 合 物 的 “一 潭 死水 ”会 在 一 道内 电 的 作用 下 涌现 出 有 
机 的 生命 。) 目前 的 人 工 神经 网 络 是 一 个 确定 性 系统 ， 虽 然 我 们 可 以 
在 网 络 里 引入 随机 性 ,但 古 我 们 并 不 清楚 在 哪里 和 怎样 引入 这 些 随 机 
性 。 这 样 的 随机 性 有 几乎 无 数 的 可 能 组 合 ， 任 何 “ 不 对 ”的 组 合 都 可 能 
使 系统 无 法 产生 “ 清 现 ”。 人 脑 是 动物 儿 十 亿 年 进化 的 结果 ， 其 中 淘汰 
了 无 数 无 法 产生 意识 的 随机 组 合 。 从 这 点 上 看 人 工 神经 网 络 是 否 能 最 
终 “ 清 现 ? 出 意识 仍然 是 一 个 巨大 的 问号 ， 也 许 需 要 非 稼 长 的 时 间 和 非 


常 好 的 运气 。 


结束 语 


人 类 该 起 么 办 


一 切 都 清楚 地 表明 了 机 硕 对 事物 间 隐 蔽 的 相关 性 的 发 现 和 掌握 已 
经 远 超 人 类 。 机 喜 学 习 正 在 拓展 出 人 类 知识 的 一 个 全 者 方向 ， 让 人 类 
可 以 利用 那些 目 己 无 法 理解 的 暗 知 识 去 解决 问题 ， 这 些 暗 知识 的 总 量 
将 会 大 大 超过 人 类 积累 的 和 即将 发 现 的 明知 识 。 随 着 计算 能 力 的 提高 
和 各 类 算法 的 进展 ， 机 器 学 习 会 呈现 出 越 来 越 神 奇 的 性 能 。 这 一 波 科 
技 进步 的 大 少 在 可 预见 的 未 来 还 看 不 到 售 滞 的 迹象 

人 类 和 是否 能 理解 知识 变 得 不 那么 重要 了 “。 在 过 去 的 几 万 年 里， 人 
类 的 大 脑 永 远 在 知识 获取 的 回路 当中 ， 没 有 “人 ”这 个 认 知 行为 的 主体 
下 谈 不 上 知识 。 而 今天 一 切 都 显 覆 了 ， 机 器 也 成 了 认 知 主体 ， 可 以 直 
接 从 数据 中 萃取 出 知识 来 ， 再 把 这 些 知 识 应 用 到 世界 里 。 人 脑 第 一 次 
被 扫 出 了 知识 获取 的 回路 ， 机 器 甚至 会 成 为 压倒 性 的 认 知 主体 ， 越 是 
复杂 的 问题 ， 它 们 越 是 得 心 应 手 。 

这 并 不 是 人 类 第 一 次 发 明了 比 目 己 强 的 工具 ， 从 第 一 次 折断 树枝 
作为 大 棒 开始 ， 人 类 已 经 有 无 数 超过 目 己 能 力 的 工具 。 只 不 过 这 次 不 
再 是 比 人 的 腹 彩 力气 大 ， 比 腿 跑 得 快 ， 比 眼睛 看 得 远 ， 而 是 比 大 脑 更 


能 觉察 万 事 万 物 间 的 隐蔽 关系 。 在 机 右 没 有 演化 出 目 我 意识 之 前 ， 它 
们 仍然 钙 人 类 任 劳 任 弘 的 工具 。 


一 代 代 更 聪明 的 机 妖 将 不 分 重 夜 地 工作 ， 进 入 每 一 个 可 以 产生 数 
据 的 生活 、 生 产 和 消费 过 程 。 机 器 将 从 这 些 过 程 中 不 断 发 现 新 的 知 
识 ， 反 过 来 再 用 于 改进 这 些 过 程 使 效率 更 高 。 没 有 任何 一 个 重要 的 领 
域 不 锌 机 融 涉 足 ， 没 有 任何 一 个 人 不 被 机 需 影 响 。 

对 机 和 需 知 识 的 占有 不 仅 会 改变 权力 的 分 配 ， 也 会 改变 权利 的 定 
义 。 我 们 所 熟知 的 社会 规范 ， 诸 如 和 目 由 、 平 等、 公平 、 正 义 在 瞳 知 识 
的 衬托 下 将 会 改变 原来 的 意义 。 我 们 要 重新 审视 我 们 过 去 熟悉 的 观 
念 ， 重 新 思考 什么 是 一 个 “好 ?的 社会 。 

机 句 改 写 了 知识 的 地 图 ， 却 无 法 改变 人 的 本 性 。 人 类 还 是 那个 利 
他 与 目 私 同体 ， 同 情 与 冷酷 兼备 的 人 类 。 对 于 这 样 一 个 新 的 强大 工 
具 ， 生 存 本 能 将 驱使 人 类 用 它 为 已 谋 利 ， 博 诫 困境 也 必 将 导致 用 它 来 
伤害 他 人 ， 对 机 器 的 区 台 和 瞳 知 识 的 掌握 势必 改变 现 有 的 地 绎 平衡 。 

在 造福 人 类 的 同时 ， 和 过 去 500 年 中 大 部 分 新 科技 一 样 ， 机 需 将 市 
来 不 可 预知 的 改变 和 挑战 。 这 些 改变 无 法 阻挡 ， 只 能 顺势 而 为 ， 这 些 
挑战 无 法 避免 ， 只 能 创造 性 地 应 对 。 人 类 在 过 去 的 500 年 中 经 历 过 无 数 
挑战 ， 与 之 相 比 这 次 不 算 最 大 。 在 可 见 的 未 来 ， 人 类 要 担心 的 不 是 机 
圳 ， 人 类 社会 的 最 大 风险 仍然 来 目 人 类 本 号 。 
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附录 1: 一 个 经 典 的 5 层 神经 网 络 LeNet-5 


图 附 1.1 是 由 人 工 智 能 大 神 之 一 岩 : 拉 孔 (CNN 的 发 明 人 ) 提出 的 
典型 的 卷 积 网 络 LeNet-5。 这 个 网 络 的 左边 古 输 入 的 得 识别 的 图 像 ， 最 
右边 有 10 个 输出 ， 因 此 可 以 识别 10 种 不 同 的 图 像 ， 例 如 手写 体 的 0， 
1 了 2 9 


LeNet-5 
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图 附 1.1 岩 - 拉 扎 提出 的 卷 积 网 络 LeNet-5 
图 片 来 源 : http://yann.lecun.com/exdb/lenet/。 
输入 独 像 的 大 小 是 32x32。 网 络 的 第 一 层 是 眷 积 层 ， 所 谓 “ 眷 积 " 束 

是 拿 着 各 种 不 同 的 小 模板 (图 附 1.1 的 模板 大 小 是 5x5) 在 一 张大 图 上 
滑动 找 相似 的 图 形 (每 个 模板 是 一 个 特定 的 图 形 ， 例 如 三 角 、 方 块 、 
直线 、 弧 线 等 ; 。 模 板 在 大 图 中 一 个 一 个 像素 滑动 ， 在 每 一 个 滑动 位 
置 ， 都 把 大 图 上 的 像素 值 和 模板 对 应 的 像素 值 相 乘 再 全 部 加 起 来 ， 把 
这 个 加 总 之 和 作为 一 个 新 的 输出 像素 。 当 模板 滑动 过 所 有 像素 时 ， 这 
些 新 的 像素 忠 构 成 一 张 狐 的 大 图 。 在 模板 消 动 过 程 中 ， 每 当 磁 上 大 图 


中 有 类 似 模 板 上 的 图 形 ( 即 在 大 图 上 这 个 区 域 的 图 形 和 模板 重合 度 高 
时 ) ， 新 的 像素 值 就 会 很 大 。 图 附 1.1 的 模板 尺寸 是 5x5， 因 此 在 32x32 
的 输入 图 像 上 横竖 都 只 能 滑动 28 次 ， 所 以 卷 积 的 结果 是 一 张 28x28 的 
图 片 。 在 这 个 网 络 里 ， 第 一 层 使 用 了 6 个 模板 ， 所 以 第 一 层 卷 积 后 出 来 
6 张 28x28 的 图 片 。 


卷 积 的 结 末 出 来 后 ， 对 每 一 个 像素 还 要 做 一 个 “ 非 线性 ”处 理 。 一 
种 “ 非 线 性 ?处理 方法 驶 是 把 所 有 人 小 于 零 的 像素 值 用 零 来 代替 ， 这 样 做 
的 目的 是 让 网 络 增加 复杂 性 ， 可 以 识别 更 复杂 的 图 形 。 


网 络 的 第 二 层 叫 采样 层 (down-sampling) 或 汇集 层 (pooling) ， 
简单 讲 采 样 层 就 是 把 大 图 变 小 图 。 在 这 个 网 络 里 ， 采 样 的 方法 是 用 一 
个 2x2 的 透明 小 窗 在 图 片上 滑动 ， 每 次 挪动 2 个 像素 。 每 挪动 一 个 位 
置 ， 把 小 窗 内 的 4 个 像素 的 最 大 值 取 出 来 作为 下 一 层 图 片 中 的 一 个 像素 

(除了 取 最 大 值 ， 也 可 以 有 取 平 均值 等 其 他 方法 ) 。 经 过 这 样 的 采 
样 ， 就 产生 了 下 一 层 6 张 14x14 的 图 片 。 

这 个 网 络 的 第 三 层 又 是 一 个 卷 积 层 ， 这 次 有 16 个 5x5 大 小 的 模 
板 ， 在 14x14 的 图 片上 产生 16 张 10x10 的 图 片 (5x5 的 模板 在 14x14 的 图 
片 的 横竖 方向 上 都 只 能 滑动 10 次 ) 。 


第 三 层 做 完 非 线性 处 理 后 ， 第 四 层 又 是 一 个 采样 层 ， 把 16 张 
10x10 的 图 片 变 成 16 张 5x5 的 图 片 。 


第 五 层 再 次 用 120 个 5x5 模 板 对 16 张 5x5 的 图 片 做 卷 积 。 每 个 模板 
同时 对 所 有 16 张 图 片 一 起 卷 积 ， 每 个 模板 产生 一 个 像素 ， 一 共产 生 120 
个 像素 ， 这 120 个 像素 就 成 为 下 一 层 的 输入 。 从 这 里 开始 ， 原 始 的 一 张 
32x32 的 输入 图 片 变 成 了 120 个 像素 。 每 个 像素 都 代表 着 某 个 特征 。 从 
这 一 层 开始 下 面 就 不 再 做 卷 积 和 采样 了 ， 而 是 变 为 “全 连接 ”的 标准 神 
经 网 络 ， 即 第 五 层 的 120 个 神经 元 和 第 六 层 的 80 个 神经 元 中 的 每 一 个 都 
连接 。 〈 不 要 问 为 什么 第 六 层 是 80 个 而 不 是 79 个 或 81 个 ， 答 案 是 没 太 
多 道理 。) 


第 六 层 的 80 个 神经 元 和 第 七 层 (最 后 一 层 ， 即 输出 层 ) 的 10 个 神 
经 元 的 每 一 个 都 相连 接 。 


以 上 卷 积 + 非 线 性 + 采样 可 以 看 成 卷 积 网 络 的 一 个 单元 ， 这 个 单元 
的 作用 就 是 “提取 特征 + 压缩 *"， 在 一 个 卷 积 网 络 中 可 以 不 断 地 重复 使 用 
这 个 单元 。 今 天 大 型 的 卷 积 网 络 可 能 有 几 百 次 这 样 的 重复 ， 在 这 个 例 
是 复 相 二 /et 

卷 积 网 络 为 什么 这 样 设计 ? 为 什么 分 为 卷 积 和 全 连接 两 个 不 同 的 
部 分 ? 简单 说 是 省 了 计算 。 如 果 用 全 连接 多 层 网 络 ， 那 么 输入 层 要 有 
32x32=1 024 个 神经 元 ， 在 LeNet 中 最 后 压缩 到 120 个 。 压 缩 的 原理 就 在 
于 对 识别 一 张 图 像 来 说 ， 只 有 图 像 中 的 某 些 特征 是 相关 的 。 例 如 识别 
人 脸 ， 主 要 是 五 官 的 特征 有 用 ， 至 于 背景 是 蓝天 白云 还 是 绿 树 红 花 都 
无 所 谓 。 卷 积 的 模板 就 是 要 提取 出 那些 最 相关 的 特征 。 注 意 ， 这 里 模 
板 并 不 需要 事先 设计 好 ， 模 板 中 的 各 像素 的 数值 ， 就 是 神经 网 络 各 层 
的 加 权 系 数 。 根 据 训 练 数据 的 不 同 ， 通 过 前 述 的 最 陡 下 降 法 ， 模 板 各 
像素 取 值 最 终 也 不 同 〈《 即 训练 数据 都 是 人 脸 和 训练 数据 都 是 动物 最 终 
演化 出 来 的 模板 不 同 ) 。 每 一 层 使 用 多 少 个 模板 要 在 识别 率 和 计算 量 
之 间 找 一 个 平衡 ， 模 板 越 多 识别 越 准 确 ， 但 计算 量 也 越 大 。 


附录 2: 循环 神经 网 络 RNN 和 长 - 短 时 记忆 
网 络 LSTM 


循环 神经 网 络 RNN 


CNN 比 较 适 合 处 理 图 像 ， 因 为 每 幅 图 像 之 间 都 没有 太 多 相关 性 ， 
所 以 可 以 一 幅 一 幅 地 输入 CNN 里 。 但 许多 非 图 像 信息 例如 语 首 、 天 气 
预报 、 股 市 等 是 一 个 连续 的 数值 序列 ， 不 仪 无 法 截 成 一 段 一 段 地 输 
入 ， 前 后 之 间 还 有 很 强 的 相关 性 。 例 如 我 们 在 下 面 句 子 里 猜 词 填 
空 : “我 是 上 海 人 ， 会 讲 话 。” 在 这 里 如 采 我 们 没有 看 到 第 一 
人 句 “ 我 是 上 海 人 ” 束 很 难 填空 。 处 理 这 一 类 问题 最 有 效 的 神经 元 网 络 叫 
循环 神经 网 络 。 图 附 2.1 是 一 个 最 简单 的 RNN 。 


图 附 2.1 最 简单 的 RNN 
这 里 X, 是 时 刻 的 输入 向 量 ，A 是 神经 元 网 络 ，h 是 时 刻 的 输出 。 
注意 到 方 框 A 有 一 个 自我 反馈 的 第 涉 ， 网 络 A 下 一 时 刻 的 状态 依赖 于 上 
一 时 刻 的 状态 ， 这 是 RNN 和 CNN 及 全 连接 网 络 的 最 大 的 区 别 。 为 了 更 


清楚 地 理解 图 附 2.1， 我 们 可 以 把 每 个 离散 时 间 网 络 的 状态 都 画 出 来 生 
成 图 附 2.2。 


图 附 2.2 把 RNN 从 时 间 上 展开 看 


这 个 链 状 结构 展现 出 RNN 与 列表 、 数 据 流 等 序列 化 数据 的 密切 天 
系 ， 而 这 类 数据 的 处 理 也 确实 在 使 用 RNN 这 样 的 神经 网 络 。 在 过 去 几 
年 中 ， 将 RNN 应 用 于 很 多 问题 后 ， 已 经 取得 了 难以 想象 的 成 功 ， 例 如 
语音 识别 、 语 言 建 模 、 翻 译 、 图 像 抓 取 等 ， 而 它 所 涉及 的 领域 还 在 不 
断 地 增加 。 


现在 我 们 已 经 知道 了 RNN 是 什么 ， 以 及 基本 的 工作 原理 。 下 面 我 
们 通过 一 个 有 趣 的 例子 来 加 深 对 RNN 的 理解 : 训练 一 个 基于 字符 的 
RNN 语 言 模型 。 我 们 的 做 法 是 ， 给 RNN“ 喂 ”大 段 的 文字 ， 要 求 它 基于 
前 一 段 字 符 建立 下 一 个 字母 的 概率 分 布 ， 这 样 我们 束 可 以 通过 前 一 个 
字母 预测 下 一 个 字母 ， 这 样 可 以 一 个 字母 一 个 字母 地 生成 新 的 文字 。 
举 一 个 简单 的 例子 ， 假 设 我 们 的 字母 库 里 只 有 4 个 字母 可 
选 : “he”1“o"， 我 们 想 训 练 出 一 个 能 产生 "hello" 顺 序 的 RNN， 这 个 
训练 过 程 事实 上 是 4 个 独立 训练 的 组 合 。 
1) 给 出 字母 “<h*" 后 ， 后 面 大 概率 是 字母 “e”。 
2) 给 出 字符 “he" 后 ， 后 面 大 概率 是 字母 "7”。 
给 出 字符 “he 后 ， 后 面 大 概率 还 是 字母 "”。 
给 出 字符 “hell* 后 ， 后 面 大 概率 是 字母 “0”。 


( 
2 
(3) 
(4) 


具体 来 说 ， 我 们 可 以 将 每 个 字母 编码 成 一 个 同 量 ， 这 个 向 量 除了 
该 字母 顺序 位 是 1， 其 余 位 置 都 是 0 (例如 对 于 “h” 而 言 ， 第 一 位 是 1， 
其 余 位 置 都 是 0， 而 “e” 则 第 二 位 是 1， 其 余 位 置 是 0) 。 之 后 我 们 把 这 
些 向 量 一 次 一 个 地 “ 暖 ”给 RNN， 这 样 可 以 得 到 一 个 四 维 输出 向 量 序列 
(每 个 维度 对 应 一 个 字母 ) ， 这 个 向 量 序列 我 们 可 以 认为 是 RNN 目 前 
认为 每 个 字母 即将 在 下 一 个 出 现 的 概率 。 


图 附 2.3 是 一 个 输入 和 输出 层 为 4 维 ， 隐 含 层 为 3 个 单元 (神经 元 ) 
的 RNN。 图 中 显示 了 当 RNN 被 <“ 喂 > 了 字符 “hell” 作 为 输入 后 ， 前 向 传递 
是 如 何 被 激活 的 。 输 出 层 包括 RNN 为 下 一 个 可 能 出 现 的 字母 (字母 表 
里 只 有 h、e、1、o 4 个 字母 ) 所 分 配 的 概率 ， 我 们 希望 输出 层 加 粗 的 数 
越 大 越 好 ， 输 出 层 其 他 的 数 越 小 越 好 。 例 如 ， 我 们 可 以 看 到 在 第 一 步 
上 时，RNN 看 到 字母 “<h”， 它 认为 下 一 个 字母 是 “h”* 的 概率 是 1.0， 是 “e” 的 
概率 是 2.2， 是 “]” 的 概率 是 -3.0， 是 “0” 的 概率 是 4.1。 由 于 在 我 们 的 训 
练 数据 〈 字 符 串 “hello”) 中 ， 正 确 的 下 一 个 字母 是 “e >?， 所 以 我 们 希望 
提升 “e” 的 概率 ， 同 时 降低 其 他 字母 的 概率 。 同 样 地 ， 对 于 4 步 中 的 每 
一 步 ， 我 们 都 希望 网 络 能 提升 对 某 一 个 目标 字母 的 概率 。 由 于 RNN 完 
全 由 可 分 的 操作 组 成 ， 因 此 我 们 可 以 采用 反 癌 传播 算法 来 计算 出 我 们 
应 该 向 哪个 方向 调整 每 一 个 权 量 ， 以 便 提升 正确 目标 的 概率 (输出 层 
里 的 加 粗 数 字 ) 。 


输出 字母 。“e” > a ‘ 


输入 层 


输入 字母 : 


图 附 2.3 RNN 学 习 “hello” 语 句 的 训练 过 程 


接 下 来 我 们 可 以 进行 参数 调整 ， 即 将 每 一 个 权 值 向 着 刚才 说 的 梯 
度 方 问 微微 调整 一 点 ， 调 整 之 后 如 有 果 还 将 刚才 那个 输入 字符 “ 喂 ?给 
RNN， 我 们 就 会 看 到 正确 字母 〈 例 如 第 一 步 中 的 “e”) 的 分 值 提 高 了 一 
点 《例如 从 2.2 提 高 到 2.3) ， 而 其 他 字母 的 分 值 降低 了 一 点 。 然 后 我 们 
不 断 地 重复 这 个 步 又 ， 直 到 整个 网 络 的 预测 结果 最 终 与 训练 数据 一 
致 ， 即 每 一 步 都 能 正确 预测 下 一 个 字母 。 需 要 注意 的 是 ， 第 一 次 字 
母 人 作为 输入 时 ， 目 标 输出 是 4 ， 但 第 二 次 目标 输出 就 变 成 了 “o”， 
因此 RNN 不 是 仅仅 根据 输入 判断 ， 而 是 使 用 反复 出 现 的 关系 来 了 解 语 
言 环境 ， 以 便 完 成 任务 。 


LSTM: 记忆 增强 版 RNN 


RNN 可 以 根据 前 一 个 字母 预测 出 下 一 个 字母 。 但 有 时 候 可 能 需要 
更 前 面 的 信息 ， 例 如 我 们 要 填空 "我 在 上 海 出 生 ， 一 直 待 到 高 中 毕业 ， 
所 以 我 可 以 讲 话 ”。 此 时 如 果 没 有 看 到 第 一 名 “我 在 上 海 出 
生 * 就 猜 不 到 填空 的 内 容 。 为 了 解决 这 个 问题 ， 人 们 对 RNN 进 行 了 改 
造 ， 使 其 可 以 有 更 长 的 记忆 。 这 就 是 长 - 短 时 记忆 网 络 (LSTM) 。 


所 有 的 RNN 都 是 链 状 的 、 模 块 不 断 重 复 的 神经 网 络 ， 标 准 的 RNN 


中 ， 重 复 的 模块 结构 简单 。 如 图 附 2.4 所 示 ， 每 个 模块 由 单个 的 tanh 层 
组 成 。 
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图 附 2.4 在 标准 的 RNN 中 ， 重 复 的 模块 是 单 层 结构 


LSTM 也 是 链 状 的 ， 和 RNN 相 比 ， 其 重复 模块 中 的 神经 网 络 并 非 
单 层 ， 而 是 有 4 层 ， 并 且 这 4 层 以 特殊 的 形式 相互 作用 。 ( 见 图 附 2.5) 


已 


图 附 2.5 在 LSTM 中， 重复 模块 中 含有 相互 作用 的 4 层 神 经 网 络 


在 图 附 2.5 中 ，o (希腊 字母 sigma) 是 sigmoid 函 数 ， 其 定义 如 下 : 
I 


l+e™ 


o (XX)= 


这 个 sigmoid 函 数 的 图 形 如 图 附 2.6 所 示 。 


图 附 2.6 sigmoid 画 数 的 图 形 
tanh 画 数 是 sigmoid 画 数 的 放大 平移 版 ， 它 们 之 间 的 关系 如 下 : 
tanh (x) =20 (2:x) -1 
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图 附 2.7 sigmoid 画 数 和 tanh 画 数 曲 线 
不 要 被 上 面 这 么 多 复 洒 的 东西 吓 着 ， 我 们 等 一 下 会 详 述 LSTM 的 
结构 。 从 现在 开始 ， 请 试图 熟悉 和 适应 我 们 将 使 用 的 一 些 符号 。 
在 图 附 2.8 中 左 起 ， 长 方形 表示 已 经 学 习 的 神经 网 络 层 ; 圆圈 代表 
逐 点 运算 ， 研 像 向 量 加 法 ， 单 箭头 代表 一 个 完整 的 向 量 ， 从 一 个 慷 扩 
的 输出 指向 另 一 个 节点 的 输入 ; 合并 的 箭头 表示 关联 :分 又 的 箭头 表 


示 同 样 的 内 容 被 复制 并 发 送 到 不 同 的 地 方 。 


神经 网 络 层 逐 点 运算 问 量 转移 关联 复制 


图 附 2.8 LSTM 中 使 用 的 符号 


LSTM 青 后 的 核心 


LSTM 的 天 键 是 单元 状态 ， 即 图 附 2.9 中 上 方 那 条 贯穿 单元 的 线 。 
单元 状态 有 点 像 传送 带 ， 它 在 整个 链条 一 直 传 送 下 去 ， 只 有 少数 节点 
对 它 有 影响 ,信息 可 以 很 方便 地 传送 过 去 ， 你 持 不 变 。 


图 附 2.9 LSTM 的 单元 状态 


LSTM 对 单元 状态 有 增加 或 移 除 信息 的 能 力 ， 但 需要 在 一 个 叫 
作 “1]” 的 结构 下 按照 一 定 的 规范 进行 。“| ]” 是 有 条 件 地 让 信息 通过 的 
路 径 ， 它 由 一 个 sigmoid 神 经 网 络 层 和 一 个 逐 点 乘法 运算 构成 。 


图 附 2.10 LSTM 的 单元 < 门 ” 结 构 
sigmoid 层 输出 0 ~1 的 数值 ， 表 不 每 个 要 系 可 以 通过 的 程度 ，0 表 
示 “ 什 么 都 过 不 去 ”"，1 表 示 “ 全 部 通过 ”。 一 个 LSTM 有 3 个 这 样 的 “ 门 ”， 
用 来 保护 和 控制 单元 状态 。 


附录 3: CPU、GPU 和 TPU 


GPU 和 是 神经 网 络 计算 的 引擎 。 图 附 3.1 是 一 个 典型 的 神经 网 络 ， 用 
输出 座 差 来 调 广 各 层 的 权重 系数 ， 输 入 阵列 X 通 过 参数 矩阵 运算 进入 
下 一 层 运 算 ， 层 运 算 都 是 一 次 这 样 的 矩阵 运算 。 上 所谓 和 窍 阵 运算 ， 
忠 是 和 完 把 数字 相 乘 再 相 加 。 
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图 附 3.1 典 型 的 深度 神经 网 络 


为 了 帮助 那些 没有 学 过 矩阵 的 读者 加 深 理 解 ， 现 在 我 们 只 看 图 附 
3.2 中 左边 输入 和 第 一 层 中 一 个 神经 元 的 关系 : 每 一 个 输入 数字 和 圆圈 
里 的 权重 系数 相 乘 ， 然 后 把 所 有 的 乘积 加 起 来 就 得 到 一 个 值 。 例 如 ， 
输入 有 三 个 单元 ， 分 别 是 (2，5，8) ， 对 应 的 权重 系数 分 别 是 
(2，-1，0.5) ， 它 们 相 乘 后 再 相 加 是 2x2+5x (-1) +8x0.5=4-5+4=3。 
这 个 值 再 经 过 一 个 “ 非 线性 ”处理 : 这 个 值 如 果 大 于 0 就 取 原 值 ， 小 于 0 


就 取 值 为 0。 注 意 这 里 所 有 的 相 乘 运算 都 可 以 同时 进行 ， 这 束 是 所 谓 的 
可 "并行 运 算 ”。 我 们 刚才 描述 的 仅仅 是 一 个 单元 的 计算 方法 ， 其 他 单 
元 的 计算 方法 也 都 一 样 ， 也 殊 是 说 不 仅 一 个 单元 的 计算 是 可 以 并 行 
的 ， 所 有 单元 的 计算 都 是 可 以 同时 进行 的 。 
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图 附 3.2 神 经 网 络 的 一 个 单元 内 的 计算 


而 GPU 与 CPU 相 比 的 优点 正 是 在 这 里 。 当 年 设计 CPU 时 主要 为 了 
执行 计算 机 程序 ， 绝 大 部 分 计算 机 程序 都 是 “ 串 行 * 的 ， 也 就 是 后 一 个 
命令 或 计算 要 等 前 一 个 命令 或 计算 的 结果 出 来 后 才能 执行 。 而 GPU 最 
初 是 为 图 形 处 理 用 的 ， 图 形 处 理 的 一 个 特点 就 是 可 以 并 行 。 例 如 ， 从 
一 张 图 中 把 所 有 的 黑 点 找 出 来 ， 束 可 以 把 一 张 图 分 割 成 许多 小 图 同时 
来 找 黑 点 。 图 附 3.3 是 CPU 和 GPU 的 结构 对 比 ， 图 中 左边 的 CPU 通 常 由 
一 个 控制 器 (Control) 来 给 少数 几 个 功能 强大 的 算术 逻辑 运算 器 

(ALU) 分 配 任务 ， 而 右边 的 GPU 通 常 由 许多 简单 的 控制 器 ( 右 图 最 

左边 一 列 方块 ) 来 控制 更 多 的 算术 运算 单元 组 成 (那些 小 格子 ) 。 在 
图 形 和 图 像 处 理 中 大 量 的 运算 都 是 矩阵 运算 ， 所 以 GPU 从 第 一 天 起 就 
是 为 矩阵 运算 设计 的 ， 没 想到 几 十 年 后 的 深度 学 习 也 主要 是 矩阵 运 
算 ， 这 就 是 “天 上 的 馅 饼 ”。 
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图 附 3.3CPU 结 构 和 GPU 结构 对 比 


图 片 来 源 : https://www.quora.com/Does-CPU-vendors-feel-the-competition-from-GPUs- 
computational-power ° 


那么 在 神经 网 络 深度 学 习 计 算 中 GPU 比 CPU 能 好 多 少 呢 ?一 个 极 
端的 例子 是 在 深度 学 习 使 用 GPU 之 前 ， 谷 歌 使 用 16 000 个 CPU 建造 了 
一 个 超级 深度 学 习 网 络 ， 如 图 附 3.4 所 示 ， 成 本 为 数 百 万 美元 。 


几 年 后 ， 斯 坦 福 大 学 只 用 几 个 GPU 就 可 以 达到 同样 的 性 能 ， 成 本 
只 有 3 万 美元 ! 即使 考虑 到 心 族 本 身 在 几 年 内 的 发 展 ， 这 个 比较 也 是 居 
人 人 的。 当然 这 个 比较 仅仅 是 比较 深度 学 习 的 矩阵 运算 ， 合 歌 大 脑 还 可 
以 做 很 多 其 他 的 运算 ， 例 如 强化 学 习 等 。 总 的 来 说 ，CPU 适 合 串 行 运 
算 ， 可 以 胜任 从 航天 到 手机 的 各 种 不 同 复杂 运算 和 处 理 ， 而 GPU 主要 
用 于 简单 的 并 行 运算 ， 并 不 会 取代 CPU。 但 古 在 图 形 处 理 和 深度 神经 
网 络 计算 中 ，GPU 可 以 比 CPU 快 10 倍 甚至 百倍 。 英 伟 达 2017 年 推出 的 
用 于 自动 敬 驶 的 必 上 请 Xavier 已 经 达到 每 秒 20 万 亿 次 浮 点 计算 。 


图 附 3.4 谷 歌 用 16 000 个 CPU 搭建 的 深度 学 习 “ 谷 歌 大 脑 ” 


图 片 来 源 : https://amp.businessinsider.com/images/507ebdd2ecad045603000001- 480-360.jpg 。 


2006 一 2017 年 ， 单 请 CPU 的 处 理 能 力 提 高 了 50 倍 。50 倍 的 增长 不 
是 来 自 时 钟 速度 的 提高 〈 即 单 次 运算 变 快 ) ， 而 是 来 自在 心 片 中 塞 进 
更 多 的 处 理 器 。 它 的 内 核 数 量 从 4 个 变 到 28 个 ， 是 原来 的 7 倍 。 另 外 一 
个 性 能 的 提升 来 源 于 指令 的 宽度 ，2006 年 一 条 指令 只 能 处 理 2 个 单 精 度 
的 浮 点 运算 ， 今 天 512 位 的 指令 集中 ， 一 条 指令 可 以 同时 处 理 16 个 单 精 
度 的 浮 点 运算 ， 这 就 相当 于 8 倍 的 性 能 提升 。7x8=56， 约 50 倍 的 运算 
速度 提升 束 是 靠 更 多 的 处 理 絮 得 来 的 。 


> CPU 处 理 能 力 提高 了 50 售 
> ”从 2006 年 的 0.043 万 亿 次 浮 点 运算 ， 到 2017 年 的 2 万 亿 次 浮 点 运算 〈 单 精度 ) 
> 核心 数量 从 4 变 到 28 


10 000 


Xeon platinum 8180 
28 核 芯片 ，2.5GHz，AVX-512 


1 000 


峰值 每 秒 10 亿 次 浮 点 运算 


0 
2006 2008 2010 2012 2014 2016 2017 (年 份 ) 


图 附 3.5 2006 一 2017 年 CPU 运算 速度 的 进展 
图 片 来 源 ， 香 港 浸 会 大 学 褚 晓 文教 授 “ 深 度 学 习 框架 大 PK” 中 的 五 大 深度 学 习 框架 三 类 神经 网 
络 全 面 测评 。 

再 看 GPU 在 近 十 年 的 发 展 ， 图 附 3.6 是 GPU 和 CPU 的 性 能 对 比 。 
2006 年 英 伟 达 第 一 次 发 布 通用 计算 的 GPU8800GTX， 当 时 它 的 性 能 
经 达到 0.5 万 亿 次 浮 点 运算 (500 GFlops) ， 接 下 来 的 十 年 ， 大 家 可 以 
看 到 GPU 相对 CPU 的 计算 能 力 一 直 维 持 在 10~15 倍 的 比例 。GPU 从 过 去 
的 128 个 核心 变 成 5 376 个 核心 ， 这 个 增长 速度 与 CPU 相同 ， 所 以 GPU 
运算 速度 与 CPU 运算 速度 的 比值 一 直 保 持 不 变 。 


> GPU 实现 30 倍 峰值 性 能 增长 ，17 倍 能 量 效率 
> 从 2006 年 的 0.5 万 亿 次 浮 点 运算 到 2017 年 15 万 亿 次 ( 单 精 度 ) 
> 从 128 个 核心 到 5 376 个 核心 
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图 附 3.6 2006 一 2017 年 CPU 和 GPU 计算 能 力 对 比 

图 片 来 源 : 香港 浸 会 大 学 褚 晓 文教 授 “深度 学 习 框架 大 PK” 中 的 五 大 深度 学 习 框架 三 类 神经 网 
络 全 面 测评 。 

其 他 几 家 互联 网 巨头 也 不 能 眼睁睁 地 看 着 英 伟 达 探 制 着 深度 学 习 
的 命脉 。 合 歌 就 推 起 袖子 做 了 一 款 自 用 的 TPU， 设 计 思 路 是 这 样 的 : 
既然 GPU 通 过 牺牲 通用 性 换取 了 在 图 形 处 理 方面 比 CPU 快 15 倍 的 性 
能 ， 为 什么 不 能 进一步 专注 于 只 把 神经 网 络 需 要 的 矩阵 运算 做 好 ， 进 
一 步 提 高 速度 呢 ?TPU 设 计 的 核心 诀 穿 有 以 下 四 点 。 

外 一， 图 形 与 图 像 处 理 需要 很 高 的 精度 (通常 用 32 比 特 浮 点 精 
度 ) ， 而 用 于 识别 的 神经 网 络 的 参数 并 不 需要 很 高 的 精度 。 所 以 谷歌 
的 第 一 款 TPU 就 专门 为 识别 设计 ， 在 运算 上 放弃 32 比 特 的 浮 点 运算 精 
度 ， 全 部 采用 8 比特 的 整数 精度 。 

第 二 ， 由 于 8 比特 的 乘法 器 比 32 比 特 简单 4x4=16 倍 ， 所 以 在 同等 
芯片 面积 上 可 以 多 放 许 多 运算 单元 。 合 歌 的 第 一 款 TPU 就 有 65 000 个 
乘 加 运算 单元 ， 相 比 最 快 的 GPU 只 有 5 300 个 单元 ， 多 了 不 止 10 倍 。 


第 三 ， 不 论 在 多 核 的 CPU 还 是 GPU 中 ， 目 前 的 运算 速度 瓶 氏 都 是 
内 存 的 读 和 写 。 因 为 要 被 运算 的 数据 都 存 在 中 央 存 储 絮 里 ， 而 这 些 数 
字 在 运算 时 要 分 配 到 几 百 上 千 个 运算 单元 中 ， 从 存储 右 到 运算 单 元 可 
谓 “ 千 里 追 退 >， 往返 很 费时 间 。 在 TPU 里 为 了 解决 这 个 问题 ， 干 脆 把 
运算 单元 摆 成 矩阵 一 样 ， 让 被 运算 的 数据 〈 例 如 神经 网 络 的 输入 数 
据 ) 流 涪 过 这 些 运 算 单 元 ， 从 内 存 中 提取 一 个 数据 就 让 它 和 所 有 的 权 
重 系数 都 做 完 乘 法 ， 而 不 是 像 传统 CPU 或 GPU 那样 提取 一 个 数据 只 做 
一 次 运算 就 放 回 到 存储 髓 ， 做 下 一 次 运算 再 千里 过 人 巡 从 存储 器 去 取 。 
这 样 数 据 像 波 当 一 样 一 波 一 波 育 来 ， 所 以 叫 脉动 式 计算 。 

第 四 ， 一 个 专注 于 矩阵 运算 的 心 片 不 用 考虑 图 形 处 理 时 要 考虑 的 
许多 其 他 事情 ， 例 如 多 线程 、 分 义 预 测 、 跳 序 执行 等 ， 这 是 由 于 脉动 
式 计算 省 控 了 许多 暂 存 、 绥 存 等 。 整 个 运算 的 指令 只 有 和 矩阵 运算 和 取 
非 线 性 那么 几 个 ， 例 如 读数 据 、 读 参数 、 相 乘 、 素 加 、 非 线性 、 写 数 
据 等 。 人 整个 必 族 和 软件 都 变 得 非常 简单 ， 这 样 可 以 做 到 每 个 时 钟 周期 
执行 一 次 指 仿 * 


二 维 计算 (CPU ) 


权重 


三 维 计算 ( NovuMind ) 


图 附 3.7 向 量 (一 维 ) 计算 、 和 矩阵 〈 二 维 ) 计算 和 张 量 (三 维 ) 计算 
图 片 来 源 : https://mp.weixin.qq.com/s/e333KjLavEvvpNIL3u1Y4Q。 
现在 我 们 可 以 算 一 下 TPU 到 底 比 GPU 快 多 少 了 。 合 歌 第 一 代 的 
TPU 有 256x256=65 536 个 8 比特 乘 加 髓 ， 时 钟 是 700MHz， 每 秒 能 做 的 8 
比特 乘 加 运算 =65 536x700x106 =46x1012 次 乘 加 运算 ， 即 92 万 亿 次 整 
数 运算 (92 TOPS， 一 次 乘 加 运算 是 两 次 运算 ) 。 所 以 当 谷 歌 宣 称 比 
GPU 快 时 ， 是 用 整数 运算 次 数 OPS 和 浮 点 运算 次 数 FLOPS 比 。 而 GPU 
是 以 浮 点 运算 为 测量 单位 的 ， 前 面 说 过 最 新 的 英 伟 达 Xavier 运 算 速 度 
可 达 20 TFLOPS， 这 两 个 不 可 直接 相 比 ， 但 如 果 在 神经 网 络 用 于 识别 
时 (而 不 是 用 于 训练 ) ， 浮 点 和 整数 运算 造成 的 识别 准确 率 差 别 不 
大 ， 就 可 以 说 这 款 TPU 比 GPU 快 了 92/20=4.6 倍 。 对 于 谷歌 这 样 需要 大 
量 和 矩阵 运算 的 公司 可 以 节省 许多 买 GPU 的 钱 ， 并 且 加 快 了 识别 速度 
(例如 谷歌 翻译 、 图 片 识别 等 的 几 亿 用 户 非 常 在 意 处 理 速度 ) ， 更 重 
要 的 是 把 核心 能 力 控制 在 了 上 自己 手 里 。 谷 歌 在 云 服务 方面 没有 亚 马 过 
做 得 好 ， 正 在 理 起 直 追 ， 有 了 TPU 则 可 以 给 用 户 提 供 更 快 、 更 便宜 的 
深度 学 习 云 服务 ， 所 以 谷歌 的 TPU 目 前 只 给 自己 用 ， 不 卖 给 别人 。 合 
歌 的 第 二 代 TPU 已 经 能 够 进行 32 比 特 的 单 精度 浮 点 运算 ， 这样 从 训练 
到 识别 都 不 需要 买 别人 的 GPU 了 。 用 浮 点 运算 做 识别 还 有 一 个 好 处 就 
是 通过 浮 点 运算 训练 出 来 的 模型 可 以 直接 用 于 识别 ， 而 不 是 像 第 一 代 
TPU 那 样 先 要 把 那些 32 比 特 的 参数 集 都 量化 为 8 比特 。 但 是 通过 刚才 的 
讨论 ， 我 们 知道 TPU 更 快 的 一 个 重要 原因 是 放弃 浮 点 运算 ， 当 TPU 世 
需要 浮 点 运算 时 ， 相 比 GPU 的 性 能 提高 就 不 会 那么 大 了 。 合 歌 的 第 二 
代 (TPU2.0) 可 以 达到 每 秒 45 万 亿 次 单 精 度 浮 点 运算 ， 和 英 伟 达 
Xavier 记 片 比 只 快 了 一 倍 〈TPU2.0 在 Xavier 之 后 出 来 ， 快 一 倍 就 不 算 
什么 ) 。 在 2018 年 谷歌 开发 者 大 会 上 ， 谷 歌 又 宣布 了 第 三 代 
(TPU3.0) ， 宣 称 比 TPU2.0 快 8 倍 。 由 于 功 耗 的 提高 ， 所 以 第 三 代 必 
片 已 经 需要 液体 制冷 。 一 个 第 三 代 的 TPU 集 群 (一 个 机 柜 ) 有 64 块 板 
卡 ， 每 块 板 卡 上 有 4 个 TPU， 总 运算 速度 可 以 达到 每 秒 8x45x4x64=92 
160 万 亿 次 浮 点 计算 。 


附 永 4: 机 硕 学 习 的 主要 编 和 框架 


® 


TensorFlow 


TensorFlow 是 由 合 歌 大 脑 团队 开发 的 ， 主 要 用 于 机 妖 学 习 和 深度 
神经 网 络 的 研究 。2016 年 5 月 ， 谷 歌 从 Torch (一 种 编程 框架 ) 转移 到 
TensorFlow， 这 对 其 他 编程 框架 造成 了 打击 ， 特 别 是 torch 和 theano。 许 
多 人 将 TensorFlow 描 述 成 一 个 比 theano 更 现代 化 的 版 本 ， 吸 取 了 这 些 年 
在 新 领域 /技术 的 许多 重要 的 经 验 教训 。 


TensorFlow 以 智能 、 灵 活 的 方式 而 闻名 ， 是 一 种 高 度 可 扩展 的 机 
性 学 习 系 统 ， 使 其 更 容易 适应 不 同 的 新 旧 产 品 和 人 研究， 并 且 比 较 容 易 
安装 ， 还 针对 初学 者 提供 了 教程 ， 涵 盖 神经 网 络 的 理论 基础 和 实际 应 
用 。TensorFlow 比 theano 和 torch 慢 ， 但 谷歌 和 开源 社区 正在 解决 这 个 问 
题 。TensorBoard 是 TensorFlow 的 可 视 化 模块 ， 它 提供 了 一 个 计算 路 径 
的 直观 视图 。 深 度 学 习 库 Keras 锐 移植 天 TensorFlow 上 运行 ， 这 意味 着 
任何 用 Keras 编 写 的 模型 现在 都 可 以 运行 在 TensorFlow 上 。 最 后 ， 值 得 
一 提 的 是 TensorFlow 可 以 在 各 种 硬件 上 运行 。 其 特点 如 下 。 


GPU 加 速 : 支持 。 


As 


(1 

(2) 语言 /界面 : Python、Numpy、C++。 
(3) 平台 : 路 平台 。 
(4) 


4) 维护 者 : 谷歌 。 


theano 


theano 起 源 于 2007 年 在 蒙特 利 尔 大 学 的 知名 MILA (学 习 算 法 研究 
所 ) ， 是 用 Python 编写 的 CPU/GPU 符 号 表达 式 的 深度 学 习 编译 器 。 
theano 功 能 强大 ， 速 度 极 快 ， 并 且 有 灵活， 但 通常 被 认为 是 一 个 底层 框 
架 。 因 此 ， 原 生 theano 更 像 是 一 个 研究 平台 和 生态 系统 ， 而 非 次 度 学 
习 库 ， 它 经 常 被 用 作 高 级 程序 库 的 底层 平台 ， 而 这 些 高 级 库 给 用 户 提 
供 简 单 的 API。theano 提 供 一 些 比 较 受 欢迎 的 库 包括 Keras、Lasagne 和 
Blocks。theano 的 缺点 之 一 是 仍然 需要 一 个 文 持 多 GPU 的 方案 。theano 
的 特点 如 下 。 


(1) GPU 加 速 : 支持。 

(2) 

(3) 平台 : Linux、Mac OS X 和 Windows。 
(4) 维护 者 : 蒙特利尔 大 学 MILA 实 验 室 。 


“torch 


在 所 有 常见 的 框架 中 ，torch 可 能 是 最 容易 启动 和 运行 的 ， 特 别 是 
在 使 用 Ubuntu (一 种 开源 电脑 操作 系统 ) 的 情况 下 。 它 允许 基于 神经 
网 络 的 算法 在 GPU 硬件 上 运行 ， 而 不 需要 在 硬件 级 别 进行 编码 。torch 
在 2002 年 由 纽约 大 学 开发 ， 被 Facebook 和 Twitter 等 大 型 科技 公司 广泛 
使 用 ， 并 得 到 英 伟 达 的 支持 。Torch 是 用 一 种 叫 作 Lua 的 脚本 语言 编写 
的 ， 这 种 语言 很 容易 阅读 ， 但 并 不 像 Python 那样 通用 。 有 用 的 错误 提 
示 消 息 、 大 量 的 示例 代码 /教程 以 及 Lua 的 简单 性 让 torch 很 容易 上 手 。 
其 特点 如 下 。 

(1) GPU 加 速 : 支持 。 


(2) 语言 7? 蜡 面 :Laid 


语言 /界面 : Python，Numpy。 
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(3) 平台 : Linux、Android、Mac OS X、iOS 和 Windows。 
(4) 维护 者 : Ronan、Clément、Koray 和 Soumith 。 


Caffe 


Caffe 被 开发 用 于 利用 卷 积 神经 网 络 的 图 像 分 类 / 机 器 视觉 ， 由 1 
000 多 名 开发 人 员 推 动 其 发 展 。Caffe 最 出 名 的 可 能 是 ModelZoo 模 型 ， 
开发 者 无 须 编 写 任何 代码 就 可 以 直接 使 用 。 


Caffe 主 要 针对 工业 应 用 ， 而 torch 和 theano 是 为 研究 量 身 打造 的 。 
Caffe 不 适用 于 非 计 算 机 视觉 深度 学 习 应 用 ， 如 文本 、 声 首 或 时 间 序 列 
数据 。Caffe 可 以 在 各 种 硬件 上 运行 ， 并 且 CPU 和 GPU 之 间 的 切换 可 以 
通过 设置 单个 标志 来 完成 。Caffe 的 运行 速度 比 theano 和 torch 要 慢 。 其 
特点 如 下 。 


(1) GPU 加 速 : 支持 。 


(2) 语言 /界面 : C、C++、Python、MATLAB、CLI。 
(3) 平台 Ubuntu、Mac OS X、Windows 实 验 版 。 
(4) 维护 者 : 伯克利 视觉 和 学 习 中 心 (BVLC) 


国 Microsoft 


CNTK 


CNTK 是 微软 深度 学 习 工 具 包 ， 是 微软 的 开源 深度 学 习 框 架 。 
CNTK 在 语音 社区 中 比 在 一 般 深度 学 习 社 区 中 更 为 车 名， 可 以 用 于 图 
像 和 文本 训练 。CNTK 文 持 多 种 算法 ， 例 如 Feed Forward、CNN、 
RNN、LSTM 和 Sequence-to-Sequence。 它 可 以 运行 在 许多 不 同 的 硬件 
类 型 上 ， 包 括 多 个 GPU。 其 特点 如 下 。 


(1) GPU 加 速 : 支持 。 
(3) 语言 /界面 : Python、C++、C 世 和 CLI。 


(4) 平台 : Windows、Linux。 
(5) 维护 者 : 微软 研究 院 。 
H2O.a | 


os 征 世界 上 使 用 最 广泛 的 开源 深度 学 习 平台 之 
° 它 被 全 球 超过 8 万 名 数据 科学 家 和 人 研究 人 员 以 及 超过 9000 家 企业 和 
i 包括 为 全 球 最 有 影响 力 的 一 些 公司 开发 关键 任务 数据 产 
。H20 提 供 基于 Web 的 用 户 界 面 ， 同 时 可 以 访问 机 右 学 习 软 件 库 ， 


eri # 学 习 的 过 程 。 


维基 百科 中 有 一 张 表 详 细 列 出 了 各 主要 编程 框架 的 参数 和 特点， 
链接 如 下 : 


https://en.wikipedia.org/wiki/Comparison_of_deep_learning_software 
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